Stage BAC+5 - Data Science appliquées en recherche médicale - F/H/D

Stage(6 mois)
Lyon
Salaire : Non spécifié
Télétravail non autorisé
Expérience : > 6 mois
Éducation : Bac +5 / Master
Postuler

bioMérieux
bioMérieux

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Sujet – Data Science appliquées en recherche médicale: implémentation et comparaison d’outils d’imputation de données manquantes, appliquées aux données issues de Dossiers Patients Electroniques (EHR), intégrés au sein d’un pipeline de Machine Learning en recherche médicale.

Les dossiers de santé électroniques (EHR) sont devenus une source essentielle de données dans le domaine médical, offrant une mine d’informations précieuses pour la recherche et l’amélioration des soins de santé. Cependant, ces données sont souvent fortement incomplètes, ce qui pose des défis importants pour leur analyse et leur utilisation efficace. L’imputation des données manquantes est une technique cruciale pour pallier ce problème, permettant de compléter les ensembles de données et d’améliorer la qualité des analyses et des études de recherche associées.

Vos missions principales seront de :

  • répertorier et synthétiser les méthodes à l’état de l’art publiées dans la littérature scientifique pour répondre à la problématique posée,            
  • implémenter et comparer les résultats générés par certaines de ces méthodes d’imputation dans le contexte des EHR. L’objectif sera de déterminer quelles méthodes offrent les meilleures performances en termes de précision, robustesse, et polyvalence, tout en tenant compte des spécificités des données de santé. A minima un jeu de données EHR réel sera utilisé afin d’appliquer toutes ou partie des méthodes identifiées (MIMIC-IV, Johnson et al. 2023),
  • générer des recommandations et produire des outils réutilisables afin d’accélérer les étapes de description et d’imputation des données manquantes, étape cruciale dans le développement d’algorithmes prédictifs.

Les compétences demandées s’articulent quant à elles autour des mathématiques et des statistiques (Data processing, Machine Learning, etc.), et des connaissances des métiers propres à la recherche médicale.


Profil recherché

Description du profil :

  • Actuellement en dernière année de formation BAC+5 ou de cycle ingénieur avec une spécialisation Data Science / Statistiques, appliquée en recherche médicale.
  • Vous avez une forte appétence pour le domaine des sciences du vivant et de la recherche médicale appliquée.
  • Vous disposez d’une expérience en Analyse de Données.
  • Vous êtes à l’aise avec le langage de programmation R et/ou Python, les outils de versioning de code tels que Git. Vous êtes familiers avec les suites d’outils utilisées pour implémenter des approches d’apprentissage automatisé (caret, Sklearn, PyTorch and TensorFlow).
  • Vous êtes autonome, rigoureux(se), faites preuve de curiosité technique et scientifique, ainsi que d’esprit critique.
  • Vous avez le sens de la communication écrite et orale dans un environnement multidisciplinaire.

Ce stage est prévu pour une durée de 6 mois. Ce stage est basé à Marcy L’Etoile, site accessible en transports en commun via la ligne de bus 98 ou 98E de Gorge de Loup.

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Postuler