Au sein du Datalab, le data scientist (F/H) travaille avec un product owner, un data scientist senior, des ingénieurs et un analyste de données pour développer des cas d’usages mobilisant des données et à fort impact.
Au sein d’une équipe produit suivant la méthode agile, vous aurez pour mission d’opérer l’analyse des données et développer des modèles et des algorithmes.
Vous serez chargé(e) de :
- Développer des analyses, des traitements, des modèles et des algorithmes sur les données manipulées dans le cadre des cas d’usage incubés dans le Datalab afin de répondre aux besoins métiers identifiés
- Veiller à ce que les outils et traitements développés dans le cadre du Datalab soient transférables aux entités chargées de les exécuter en production dans les administrations lorsque les cas d’usage data ont démontré leur impact et sont finalisés
- Mener une veille technologique active pour mobiliser les meilleures technologies.
Au cours de la réalisation de vos missions, vous devrez être en veille permanente pour détecter des projets à impact à valoriser ou à accompagner.
L’agent(e) peut par ailleurs être amené(e) à renforcer ponctuellement les autres agents du département suivant l’intérêt du service.
Enfin, en fonction de l’évolution des priorités fixées à la DINUM et au département Etalab, il/elle peut être amené(e) à prendre ponctuellement en charge d’autres tâches et projets.
De formation supérieure (bac+5), combinée à une expérience d’au moins 3 ans en sciences des données ou d’un portefeuille de productions personnelles conséquentes ou d’une thèse de doctorat dans le domaine de la science des données ou de l’informatique. Vous disposez de connaissances aussi bien en programmation qu’en data science. Expert(e) de la donnée, vous êtes sensible à la question de la qualité des données et à leur accessibilité, à l’intelligibilité et l’explicabilité de ses travaux.
- Excellente connaissance des méthodes de traitement des données, des statistiques, du machine learning et de l’intelligence artificielle ;
- Connaissance des bonnes pratiques de développement en Python et maîtrise des bibliothèques usuelles (pandas, requests, polars, Apache Arrow, etc.), développement d’API (FastAPI)
- Maîtrise des principales bibliothèques d’apprentissage machine (Scikit-learn, Tensorflow, PyTorch) et connaissance de bibliothèques spécialisées (Transformers, Spacy, etc)
- Maîtrise du requêtage des bases de données SQL (PostgreSQL, DucKDB)
- Maîtrise de Git
- Aisance à l’orale et une capacité à vulgariser des notions techniques complexes à un public large et non-spécialiste
- Bonne compréhension de l’administration, de son fonctionnement et d’une bonne maîtrise des enjeux du numérique dans ce contexte
Les expériences suivantes seront considérées comme des atouts supplémentaires :
- Participation à des projets open-source (en tant que mainteneur ou contributeur)
- Spécialisation dans le domaine du traitement d’image ou du traitement automatique des langues (NLP)
Pour postuler à cette offre, l’envoi du CV et d’une lettre de motivation est obligatoire > https://choisirleservicepublic.gouv.fr/offre-emploi/data-scientist-hf-reference-2024-1617883/
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Boullay-les-Troux