Le stage s’inscrit dans un environnement riche en données, où plusieurs types de données sont collectées, transformées et exploitées :
Types de données :
Données structurées
Données non structurées
Données temporelles
Sources de données :
Externes : partenaires
Internes : stations Aldoria
Systèmes existants :
Base de données relationnelle MySQL
Stockage d’objets avec Amazon S3
Base de données NoSQL Cassandra
Le/la stagiaire aura pour mission de :
Auditer les données :
Analyser les données collectées, transformées et produites dans l’écosystème actuel.
Identifier les points d’amélioration en termes de qualité, de stockage et de traitement des données.
Repenser le modèle de données :
Évaluer les technologies de bases de données :
Identifier les types de données et les technologies de bases de données les plus adaptées (relationnelles, NoSQL, etc.).
Benchmarker des solutions open-source/gratuites (ex : YugabyteDB, PostgreSQL, Cassandra) en utilisant les données de l’entreprise.
Explorer la fédération de bases de données :
Compétences techniques :
Solides connaissances théoriques en stockage et traitement des données (indexation, partitionnement, contraintes, calcul distribué, etc.).
Maîtrise de Python et SQL pour l’analyse et la manipulation des données.
Expérience avec les environnements Linux et les commandes shell.
Qualités personnelles :
Curiosité et capacité à explorer de nouvelles technologies.
Rigueur et méthodologie pour mener à bien des audits et des benchmarks.
Bonne communication pour présenter les résultats et les recommandations.
Un entretien avec le manager environ 1h
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.