L’AP-HP est un centre hospitalier universitaire à dimension européenne mondialement reconnu.
Ses 38 hôpitaux accueillent chaque année 10 millions de patients : en consultation, en urgence, lors d’hospitalisations programmées ou en hospitalisation à domicile.
Elle assure un service public de santé pour tous, 24h/24, et c’est pour elle à la fois un devoir et une fierté.
L’AP-HP est le premier employeur d’Ile de-France : 95 000 personnes – médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers – y travaillent. http://www.aphp.fr
Nous recrutons un stagiaire Data Scientist pour une durée de 4 à 6 mois à partir de mars 2025, pour travailler sur une de nos thématiques de recherche au sein de l’Entrepôt de Données de Santé (EDS) de l’AP-HP. L’EDS est une base de données hébergeant les dossiers médicaux informatisés de millions de patients suivis dans les 39 hôpitaux de l’AP-HP. Ces données peuvent être structurées (pathologies, traitements, procédures, biologies hospitalières, démographie, etc) ou non structurées (comptes-rendus d’hospitalisation, prescriptions, notes de consultation, etc).
Nous travaillons sur un projet de recherche sur le diabète, financé sur une durée de 5 ans, en partenariat avec l’Inria et l’Inserm. Le poste se trouve sur deux sites : au département de santé publique de l’AP-HP (hôpital de la Pitié-Salpêtrière) et dans l’équipe de data science de l’AP-HP (campus Picpus). C’est une opportunité de travailler sur les données aux contacts des experts qui les produisent.
Le Data Scientist sera amené à travailler et à progresser sur tous les aspects de la data science. Nous utilisons principalement Python, SQL et Spark, et les études en cours traitent de problématiques de survie, de clustering et de NLP.
Selon l’appétence et l’expérience du candidat, il sera amené à travailler sur l’une des problématiques suivantes :
Développement d’algorithmes de NLP pour extraire des features depuis les comptes rendus médicaux
Classification des patients par type de diabète
Développement d’algorithmes pronostics pour la prédiction de complications
À la fin du stage, il peut s’attendre à avoir :
Effectué une revue de la littérature
Créé des features à partir de données structurées et/ou non structurées
Implémenté et évalué des modèles de machine learning pour la problématique choisie
Progressé sur la chaîne complète en data science, au contact d’experts en machine learning (équipe data science de l’AP-HP & Inria), en médecine (diabétologues de l’AP-HP) et en épidémiologie (département de santé publique)
M2 de mathématiques, informatique, machine learning ou équivalent, disponible à partir de mars-avril 2025 pour une durée de 4 à 6 mois
Expérience ou volonté de travailler sur la chaîne complète de la data science
Solide bagage en statistiques et machine learning
Confortable en SQL et Python
Capacité à collaborer entre plusieurs équipes, et à vulgariser des concepts à des non-experts
Expérience ou intérêt dans la santé publique
Connaissance des meilleures pratiques développement de code (Git, unit testing, CI/CD)
Expérience avec des outils de calcul distribués comme Spark
Nous recrutons des personnes pas des postes:
Si après la lecture de cette description de poste, vous pensez que vous n’avez pas tous les prérequis mais qu’elle correspond à là où vous voudriez être dans votre prochaine position, nous vous encourageons à postuler !
Entretien téléphonique rapide
Puis demi journée sur site (3h) d’entretiens techniques
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres