Stage, Junior Data Scientist (f/m/d) - Modèles additifs généralisés et régression censurée

Internship
Paris
Salary: Not specified
A few days at home
Apply

Decathlon Digital
Decathlon Digital

Interested in this job?

Apply
Questions and answers about the job

The position

Job description

DECATHLON DIGITAL

L’entité Data de Decathlon coordonne l’ensemble des activités visant à l’accélération et la généralisation de l’usage et la valorisation des données.

Decathlon vise à devenir la meilleure plateforme digitale de sport et l’écosystème ouvert le plus performant au monde. Nous voulons permettre à nos clients de vivre l’expérience Decathlon à travers de nombreuses expériences locales centrées sur le sport en connectant de nombreux acteurs et services tiers, de manière sécurisée et performante.

Nos équipes digitales à Lille, Paris, Amsterdam (et plus encore) qui rassemblent plus de 5000 collaborateurs sont unies pour construire et faire évoluer des produits digitaux avec l’objectif de toujours offrir la meilleure valeur à nos utilisateurs. Présents dans plus de 70 pays, Decathlon est engagé dans l'innovation, la durabilité et la satisfaction des clients.

Tu seras en charge de projets qui ont le potentiel de définir l'avenir du sport.

C'est vraiment une chance de façonner l'industrie du sport grâce aux données et à l'IA !

Dans le cadre de l’ouverture d’un poste en interne, nous recrutons un-e Junior Data Scientist en stage conventionné, basé-e, au choix à Paris ou Lille.

LE SUJET DE STAGE

Modèles additifs généralisés et régression censurée : application à la prévision de la demande

Aujourd’hui, la prévision de la demande des différents articles au niveau des magasins est assurée par des modèles prédictifs de machine learning. Ces modèles avancés fournissent à la direction logistique (supply chain) un input majeur permettant le réapprovisionnement de plus de 1000 magasins européens, chaque semaine. Il est capital que ces estimations de la demande soient pertinentes pour assurer la satisfaction de nos clients tout en évitant la production et l’acheminement de produits non nécessaires en magasin pour minimiser les durées de vie de stock et améliorer l’empreinte carbone de Decathlon. La demande est observée à travers les données de vente uniquement lorsque il n'y a pas de rupture de stock. En cas de rupture, les ventes sont évidemment limitées par le nombre de produits disponibles.

Ce problème peut être vu comme un problème de régression censurée, que l’on retrouve dans différents domaines comme l’économétrie, la santé, etc. L’objectif du stage est d'explorer la régression censurée en s’appuyant notamment sur des modèles additifs généralisés (GAM). Les GAM sont des modèles puissants et permettent de modéliser un large éventail de problèmes. Ces modèles tirent parti de la structure additive et de la non-linéarité des effets pour prédire la demande, en prenant en compte facilement des facteurs externes.

TES RESPONSABILITÉS

En tant que Data Scientist / Machine Learning junior au sein de l'équipe Data Demand & Assortment Planning, tu travailleras plus spécifiquement sur les problématiques de prévisions de vente au service de la Supply Chain. Plus précisément,

  • Tu effectueras une revue de l'état de l'art scientifique sur le domaine du forecast telles que la régression censurée, le problèmes de demand vs sales, l’utilisation des modèles additifs généralisés.
  • Tu testeras ces nouvelles méthodes sur des cas d'usage réels étudiés en ce moment dans notre équipe en appliquant les meilleurs standards de Data Science.
  • Tu implémenteras ces nouvelles fonctionnalités dans nos pipelines de Machine Learning mis en production en utilisant des principes d'ingénierie de qualité.
  • Tu communiqueras efficacement l'analyse et les résultats par le biais de visualisations, de documents et de présentations aux parties prenantes techniques et business.

Le périmètre technique :

  • Python
  • AWS (S3, MWAA, ECR, ..)
  • Jupyter
  • Databricks
  • Spark
  • Airflow

CE DONT TU AURAS BESOIN POUR RÉUSSIR

  • Tu as une expérience d'au moins de deux ans dans la programmation en Python pour manipuler des données et tirer des enseignements sur des grands volumes de données via des expériences de projets académiques, d'alternances, ou de stages en entreprise.
  • Tu maîtrises les standards d'analyses descriptives/prédictives, de statistiques avancées, et d'apprentissage automatique. Une première expérience avec des modèles de régression avancés, comme les Generalized Additive Models (GAMs), est un plus.
  • Tu as d'excellentes compétences interpersonnelles, analytiques, de communication et de présentation - la capacité de communiquer des résultats complexes de manière simple.
  • Tu aimes découvrir et résoudre des problèmes, chercher de manière proactive à clarifier les exigences et les orientations, être autonome et prendre des responsabilités lorsque cela est nécessaire.
  • Tu es particulièrement sensible à l’impact de la pratique du sport dans ta manière de travailler !
  • Tu as envie de rejoindre une entreprise à impact positif (#Tech4Good)
  • Cerise sur le gâteau : tu as déjà travaillé sur des problématiques de forecast et maîtrise les techniques de traitement de données à grande échelle

CE QUE NOUS OFFRONS

  • Possibilité de travailler au choix dans l’un des bureaux de Decathlon Digital à Lille ou Paris
  • Liberté de choix de l'outil de travail (Mac, Windows)
  • Équipe projet en local et partage avec le réseau mondial (parcours international)
  • Montée en compétences et mentorat (diversité de projets, langages et technologies, certification, events)
  • Formations internes et externes
  • Gratification de stage

DECATHLON DIGITAL

Imaginez si la technologie nous permettait de repousser les frontières et d'offrir des expériences sportives inédites. C'est précisément notre ambition chez Decathlon Digital ! Nous sommes une équipe de plus de 5 000 experts en ingénierie logicielle, gestion de produits, données, cloud et cybersécurité, répartis à Paris, Lille et Amsterdam. Ensemble, nous créons la plus vaste plateforme sportive numérique, en exploitant les innovations technologiques pour optimiser la chaîne de valeur, concevoir des expériences connectées et donner une seconde vie à nos produits.

Changeons la donne pour de bon. Notre passion du sport nous guide et nous voulons qu’elle perdure. C’est pourquoi nous nous engageons à bâtir un modèle technologique plus durable, en réduisant notre impact direct sur l'environnement, et en créant un espace sûr et inclusif pour apprendre et nous épanouir ensemble. Rejoins l’équipe et façonnons le futur du sport.

Want to know more?

These job openings might interest you!

These companies are also recruiting for the position of “Données/Business Intelligence”.

Apply