Stage Fin d'Études Data Engineering & Analytics

Résumé du poste
Stage(6 mois)
Saint-Cloud
Salaire : 1,2K à 1,5K € par mois
Télétravail non autorisé
Compétences & expertises
Contenu généré
Saisie de données
Gestion de la documentation
Langages de programmation
Collaboration et travail d'équipe
Gestion de bases de données
+5

Synapse
Synapse

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

À propos de Synapse KYC

Synapse KYC (https://www.synapse-kyc.com/) est un éditeur de logiciel innovant, spécialisé dans les solutions de Know Your Customer (KYC) et d’Anti-Money Laundering (AML) pour accompagner les institutions financières et les entreprises dans leurs obligations réglementaires. Nos solutions permettent une gestion efficace et intégrée de l’évaluation des tiers et des due diligences associées. En pleine croissance, nous cherchons à renforcer notre expertise data pour mettre la data au service du produit.

Le Contexte du Stage

Au sein de notre équipe technique, vous participerez à un projet stratégique visant à moderniser notre infrastructure de données en adoptant une approche “MODERN DATA STACK”. L’objectif principal de ce stage est de concevoir et de construire le “SYNAPSE DATA HUB” basé sur une technologie data robuste, performante, évolutive et open-source. Ce projet permettra d’améliorer notre capacité à ingérer des données, les rendre intelligibles, les enrichir et les mettre à disposition de nos clients et de nos équipes.

Vos Missions

Sous la supervision de CTO et en étroite collaboration avec notre équipe data et notre équipe produit, vos principales missions seront :

• Identification et Sélection des Technologies Open Source de la Stack Data

  • Effectuer une recherche approfondie sur les solutions open-source disponibles pour chaque composant de la modern data stack (ETL/ELT, data lake, data warehouse, outils de visualisation, orchestration, etc.).

  • Évaluer et comparer les différentes technologies open source en fonction de nos besoins (performance, scalabilité, facilité d’intégration, communauté, etc.).

  • Proposer et documenter une architecture cible détaillée pour notre modern data stack, en justifiant les choix technologiques open source.

• Construction d’un Data Lake

  • Participer à la construction d’un data lake, en y intégrant différentes sources de données open-data et fonction des besoins métier.

  • Mettre en place l’infrastructure de stockage du data lake.

• Ingestion de Données Open Data

  • Identifier et documenter les sources de données ouvertes pertinentes pour nos activités (data.gouv.fr, insee.fr, etc.) en collaboration avec les équipes produit.

  • Développer des scripts et des pipelines pour collecter et intégrer ces données.

  • Mettre en place et automatiser la mise à jour régulière de ces données.

  • Assurer la qualité et la gouvernance des données au sein du data lake.

• Développement d’un Pipeline ELT et élaborer un Data Mart Métier

  • Concevoir et développer un pipeline ELT pour transformer les données brutes du data lake en un data mart optimisé pour un besoin métier spécifique.

  • Documenter le pipeline data, les transformations appliquées et le datamart.

Mise en Place d’une Solution de Reporting et de Dashboarding

  • Sélectionner et mettre en œuvre une solution open source de reporting et de dashboarding (ex : Metabase, Superset) pour visualiser et analyser les données.

  • Concevoir et développer des rapports et des tableaux de bord interactifs pour répondre aux besoins des utilisateurs métiers.

• Documentation et Transfert de Connaissances

  • Documenter de manière claire et précise l’architecture de la modern data stack, les processus d’ingestion de données, les pipelines ELT, les modèles de données et les solutions de reporting mises en place.

  • Participer au transfert de connaissances auprès de l’équipe technique.


Profil recherché

  • Étudiant(e) en dernière année de Master 2 ou d’école d’ingénieur, spécialisé(e) en Data Science, Data Engineering, Informatique ou domaine connexe.

  • Solides connaissances en bases de données et en modélisation de données.

  • Maîtrise d’un langage de programmation orienté données (Python, etc.).

  • Familiarité avec les concepts de data warehousing, data lake et ETL/ELT.

  • Capacité à travailler de manière autonome et en équipe.

  • Esprit d’analyse, rigueur et curiosité technique.

  • Une première expérience avec des outils open source de la modern data stack (ex : AirByte, DuckDB, dbt, SQLMesh, Metabase, Superset, Kestra) serait un plus.

Ce que nous vous offrons

  • Une expérience concrète et formatrice au sein d’une entreprise en forte croissance dans le secteur de la FinTech.

  • L’opportunité de travailler sur un projet stratégique et d’avoir un impact direct sur notre infrastructure de données.

  • Un encadrement de qualité par des experts techniques passionnés.

  • Un environnement de travail stimulant et collaboratif.

  • Une gratification de stage attractive de 1200€ à 1500€ en fonction du parcours.

  • Possibilité d’évolution au sein de l’entreprise à l’issue du stage.

Informations Pratiques

  • Lieu du stage : Saint-Cloud (Île-de-France) sur site, pas de télétravail

  • Type de stage : stage conventionné de fin d’étude de 6 mois

  • Début du stage : dès que possible

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Voir toutes les offres