Ingénieur.e Machine Learning & Data Platform - CDI - Paris

CDI
Paris
Salaire : 42,9K à 48K €
Début : 14 mai 2025
Télétravail fréquent

Article 1
Article 1

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

// CONTEXTE

Rattaché-e à la directrice du Pôle digital, tu rejoindras une équipe en charge de trois missions clés :

  • Développer des produits accompagnant plus de 100 000 jeunes scolarisés de 16 à 25 ans issus de milieu populaire dans leur orientation post bac, réussite des études et insertion professionnelle

  • Aider la prise de décision sur la conception et le déploiement de nos programmes grâce à des éclairages data.

  • Anticiper de nouveaux usages/besoins, proposer des optimisation en termes d’offre ou de déploiement en s’appuyant sur les nouvelles technologies ( IA/ML etc)

Tu souhaites évoluer dans une petite équipe data ( 1 data analyst, 1 webanalyst, 1 alternante data/dev et toi ) ayant beaucoup d’impact dans la vie de notre association et développer petit à petit des compétences en leadership et mise en place de projets data stratégique ( stratégie data, gouvernance de la donnée etc )

Le Pôle digital c’est :

  • 1,8 M€ de budget par an : de quoi financer de beaux projets, avec de nombreux enjeux data !

  • 11 collaborateur-ices avec des profils variés et expertises multiples (product management, web analyse, data analyse et engineering, développement web..), riches notamment de profils ayant effectué des reconversions professionnelles

  • 4 collaborateur-ices en région et 7 à Paris : nous avons à cœur de permettre le travail à distance dans de bonnes conditions pour les collaborateurs et pour le collectif

  • une équipe jeune, engagée et valorisant les opportunités de s’imprégner du terrain (participation à des ateliers à destination de nos bénéficiaires, à des sessions d’immersion auprès de nos équipes métiers)

// TES MISSIONS

  • Infrastructure et gestion de la Data Platform, mettre en place et maintenir l’environnement technique data indispensable au fonctionnement de l’exploitation des données :

○ Concevoir, maintenir et optimiser la plateforme de données (bases, pipelines, orchestrateurs).

○ Assurer l’ingestion, la transformation et le stockage des données (ETL, ELT).

○ Gérer les accès et la sécurité des données.

○ Mettre en place et maintenir les API nécessaires aux usages data.

○ Et plus précisément :

- construction de tables pour l’équipe de data analystes

- soutien technique de l’équipe de data analystes et montée en compétences du data analyst et de la data dev

- maintien, mises à jour et import des données dans la data plateforme

- gestion et mise à jour du serveur data avec notre prestataire infrastructure

- création et maintenance des tâches d’automatisation

  • Développer les projets IA/ Data Sciences / ML du Pôle digital :

○ Développer et déployer des modèles de Machine Learning (matching mentor/mentoré, NLP chatbot, scoring d’engagement).

○ Industrialiser les algorithmes et assurer leur passage à l’échelle (MLOps, CI/CD, monitoring des modèles).

○ Travailler sur l’automatisation des tâches de data science et ML.

○ Faire évoluer notre chatbot conversationnel actuellement en POC

  • Missions transverses data :

○ Maintenance et évolution de notre référentiel de données

○ Gestion/mise à jour des outils sur le Serveur Data avec notre prestataire hébergeur

En fonction des besoins et de la montée en compétences, des missions complémentaires pourront être confiées ponctuellement ou durablement.

// NOTRE STACK

Ingénierie des données & Data Platform

  • Bases de données : SQL (PostgreSQL, MySQL, BigQuery), NoSQL (MongoDB).

  • ETL / ELT & Pipelines de données : dbt,

  • Orchestration et ingestion des données : Airbyte, et CRON SQL (à améliorer)

  • Qualité et gouvernance des données : mise en place de monitoring, gestion des anomalies, validation des données : dbt

Machine Learning & MLOps

  • Développement d’algorithmes ML : Scikit-learn, (prospectif : TensorFlow, PyTorch).

  • Déploiement et industrialisation : MLfl ow, (voire Kubefl ow, TensorFlow Serving).

  • CI/CD pour ML : Docker, Kubernetes, GitHub Actions.

Infrastructure & Cloud

  • Cloud : GCP (BigQuery,Cloud Run, Artifacts Registry, Workfl ows)

  • Gestion des API : REST APIs pour exposer des modèles ML (voire FastAPI, Flask)

Langages de programmation

  • Python (indispensable pour le ML et l’ingénierie des données).

  • Bash / Shell scripting pour l’automatisation des tâches.

Outils de gestion/ communication

  • Slack

  • Suite Google : mail/drive/agenda/meets

  • Notion pour documentation

  • JIra pour sprints avec les developpeur-euses

  • Outil de dashboarding / data visualisation : Looker studio, Metabase

// CONDITIONS & AVANTAGES

- Statut Cadre : Forfait Jours (214 jours travaillés/an)

- 26 congés et 15 RTT/an

- Télétravail : forfait de 10 jours par mois

- Tickets restaurant (prise en charge à 60% par l’employeur), mutuelle (prise en charge à 80% par l’employeur en cotisation isolée ou 68% en cotisation famille) et prévoyance, remboursement à hauteur de 60% de l’abonnement de transport et/ou Forfait Mobilités Durables mensuel (25€ ou 10€ mensuels selon usage) OU Prime de transport (25€ mensuels)

- Prise de poste souhaitée : mi mai 2025


Profil recherché

// TON PROFIL

Article 1 a de fort enjeux liés à la gestion de la qualité et de l’intégrité des données. Nous recherchons un-e expert-e technique, chargé-e notamment des infrastructures et plateformes permettant le stockage, la transformation et l’exploitation des données utilisées par les modèles ML et les analyses métier.

  • Tu es un profil polyvalent , expérimenté ( engineering et data sciences ) avec une forte teinte technique et tu es à l’aise pour faire évoluer ton poste au fur et à mesure où l’équipe se construit.

  • Tu aimes la dynamique de travail en équipe et tu es reconnu-e pour tes qualités de bon-ne communicant-e

  • Tu sais faire preuve de pédagogie quand il s’agit d’expliquer tes sujets et de mobiliser des parties prenantes multiples, notamment les interlocuteurs plus éloignés des enjeux techniques

  • Tu partages les valeurs d’Article 1 autour de l’égalité des chances

TOP 5 des Soft Skills attendues selon notre référentiel JOBREADY (découvrez et valorisez vos compétences transversales sur www.jobready.fr ) :

  • Intégration au groupe : Faculté de se diriger vers un collectif déjà constitué, d’y trouver une place et d’en devenir un membre légitime.

  • Rigueur et fiabilité : Faculté de veiller à la qualité de son action et de celle d’autrui, et de tenir compte des règles, des méthodes, des engagements et des pratiques à l’œuvre.

  • Pédagogie : Faculté de concevoir ou déployer des activités permettant de développer les apprentissages d’autres personnes.

  • Empathie : Faculté de se mettre à la place de l’autre, de se décentrer et de comprendre le point de vue de l’autre.

  • Gestion de l’incertitude et du changement : Faculté d’aborder le changement, de mener ses réflexions ou ses actions à partir de plusieurs scénarios, en incluant la gestion des risques.


Déroulement des entretiens

  • 1 entretien + test technique

  • 1 entretien avec la directrice et l’adjoint du Pôle

  • 1 entretien avec la DG et DRH

  • 1 rencontre de “fit” avec les membres de l’équipe data

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.