Data Engineer OnPrem HPC (Audio/IA)

CDI
Paris
Salaire : 50K à 60K €
Télétravail occasionnel
Expérience : > 3 ans
Éducation : Bac +5 / Master

LittleBigCode
LittleBigCode

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

Tu es passionné(e) par les environnements data exigeants, les architectures haute performance, et tu veux mettre ton expertise au service de projets IA de pointe ? Rejoins-nous !

🔎 Ton rôle chez LittleBigCode

Au sein d’un environnement OnPremise orienté HPC (High Performance Computing) et gros clusters GPU, tu interviendras sur la conception, l’optimisation et l’industrialisation de pipelines de données complexes dans le domaine audio/vidéo et IA.

Tes missions incluront :

  • Architecture & développement : Conception de pipelines robustes et scalables, orchestrés avec Airflow et construits autour de Trino, Iceberg, PostgreSQL et Minio.

  • Industrialisation : Mise en conteneur avec Docker, déploiement via Kubernetes, CI/CD avec Jenkins et gestion fine des performances (monitoring avec Prometheus et Grafana).

  • Collaboration IA : Interaction quotidienne avec des Data Scientists spécialisés en ML, DL, et GenAI, pour assurer la fluidité entre modélisation et production.

  • Audio/Vidéo & Open Source : Participation à des projets en lien avec la donnée multimédia et contribution à des solutions open source.


Profil recherché

🎓 Formation & expérience

Tu es diplômé(e) d’un Master 2 issu d’une grande école d’ingénieur ou d’une université reconnue, avec une première expérience significative dans un environnement HPC ou OnPremise. Une exposition à des projets liés à l’IA, à l’industrie ou au multimédia sera particulièrement valorisée.

🛠 Compétences techniques

  • Langages & frameworks : Excellente maîtrise de Python, FastAPI et SQL

  • Orchestration & stockage : Très bonne connaissance de Airflow, Apache Iceberg, Trino, PostgreSQL et Minio

  • Containerisation & déploiement : Expérience confirmée avec Docker, Kubernetes et Jenkins

  • Monitoring & observabilité : Maîtrise des outils Grafana et Prometheus

  • Systèmes & versioning : À l’aise avec Linux et Git

  • Bonus : Une connaissance de Ray sera un vrai plus !

⚙️ Méthodologies & environnement

  • Tu appliques les bonnes pratiques de développement : TDD, principes SOLID, design patterns, et documentation soignée

  • Tu possèdes de solides bases en réseaux et sécurité, et une bonne compréhension des architectures HPC OnPrem

  • Tu es à l’aise avec les problématiques liées à l’IA (ML/DL/GenAI) et aux données audio/vidéo

  • Tu t’intéresses activement au monde de l’open source : tu suis les tendances, contribues ou réutilises des briques existantes

🤝 Soft skills

  • Tu es autonome, rigoureux(se) et doté(e) d’un excellent esprit d’équipe

  • Tu évolues facilement dans un environnement agile (Daily, DDS)

  • Tu sais vulgariser des sujets techniques complexes et collaborer efficacement avec des profils variés (Data Scientists, équipes infra, fonctions métiers)


Déroulement des entretiens

  1. Échange RH avec Manon ou Basma

  2. Entretien technique avec un Lead Data Engineer de l’équipe

  3. Rencontre finale avec l’un de nos Partners (Yoan ou Steve)

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres