Nous recrutons un·e data scientist / analyst pour accompagner le développement du pôle de recherche et réaliser des analyses et études sur notre base de données. Il/elle aura les missions suivantes :
participer à structuration technique et méthodologique de la base de données
développer et mettre en place des outils techniques pour faciliter l’exploitation de la base
enrichir les fonctionnalités de requêtage simplifiée en base et mettre en place une interface utilisateur fonctionnelle
développer des scripts d’analyse standardisés et réutilisables
créer des tableaux de bord de visualisation de données, et poser les bases d’une vision populationnelle à destination des soignants
adapter les packages analytiques disponibles dans la littérature à la base de données
documenter, qualifier et enrichir la base de données
construire, valider et maintenir les variables issues des données (ex. : pathologies)
rédiger et actualiser la documentation technique et méthodologique associée
promouvoir les bonnes pratiques d’analyse auprès des utilisateurs et les accompagner dans la prise en main des outils
participer activement aux discussions sur les ontologies et référentiels à utiliser
mettre en place des tests de qualité et des contrôles de cohérence automatisés pour fiabiliser la base
contribuer au développement technique du pôle de recherche
participer à l’intégration de technologies (Large Language Models, OCR) à finalité d’analyse ou opérationnelle
apporter son expertise en tant qu’utilisateur final dans la définition des spécifications du futur Entrepôt de Données de Santé
collaborer à la mise en œuvre d’outils pour le screening, l’inclusion clinique, et la collecte des données patient-reported (PROMs, PREMs)
participer à la conception et réaliser des analyses et recherches sur la base de données
réaliser des analyses exploratoires et produire des visualisations claires et pertinentes :
étudier les effectifs et la représentativité des échantillons
identifier et caractériser les données manquantes
analyser les parcours de soin et les trajectoires des patients.
participer à la conception méthodologique des études
participer à l’élaboration du protocole des études, adapté aux données disponibles
suggérer des outils et méthodes d’analyse pertinents en fonction des objectifs de recherche
rédiger, si nécessaire, les plans d’analyse statistique.
réaliser des analyses statistiques descriptives et explicatives :
réalisation des analyses et rapports d’analyses robustes et documentés, conformes aux exigences de qualité de la recherche médicale.
interpréter et restituer les résultats de manière claire et synthétique, pour alimenter les publications ou prises de décision
formation et expérience :
diplôme de niveau Bac+5 minimum en statistiques, mathématiques appliquées, informatique, data science, épidémiologie, biostatistique ou santé publique avec une forte composante quantitative
une première expérience dans le domaine des données de santé ou de la recherche biomédicale est fortement appréciée
la connaissance du fonctionnement d’un entrepôt de données de santé (EDS) ou d’une base médico-administrative (SNDS, PMSI, etc.) est un plus
qualités nécessaires :
savoir-faire :
expérience en traitement, nettoyage, structuration et analyse de bases de données complexes en Python
connaissance des outils de data visualisation (Dash, Plotly, etc.).
bonne compréhension des méthodes statistiques descriptives et inférentielles
capacité rédactionnelle dans un contexte technique
savoir-être :
esprit analytique et rigueur scientifique.
autonomie dans l’organisation du travail et la conduite d’analyses
capacité à interagir avec des profils divers (cliniciens, développeurs, chercheurs, etc.)
aptitude à vulgariser les résultats d’analyses pour des publics non techniques
curiosité, capacité d’apprentissage, goût pour l’innovation et l’expérimentation
capacité à co-construire
humilité, écoute, sens de l’observation
capacité à prendre du feedback
qualités utiles (mais pas indispensables)
connaissance du contexte des données de santé (base médico-administrative, entrepôt de données de santé, etc.) appréciée
connaissances en épidémiologie ou santé publique
intérêt pour les technologies émergentes (IA, NLP, LLM, OCR…).
connaissance d’autres langages de programmation orientés data (R, SQL, SAS)
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres