Le métier de data scientist, le bonheur est dans la donnée

14 mai 2019

4min

Le métier de data scientist, le bonheur est dans la donnée
auteur.e
Géraldine Baraud

Journaliste - consultante éditoriale @rubrik-communication.com

E-commerce, finances, bancassurance, santé… Dans tous les domaines, la transformation digitale entraîne la collecte d’une quantité innombrable de données que les entreprises et les acteurs publics cherchent aujourd’hui à exploiter. Prédire avec justesse les besoins des consommateurs, anticiper de nouvelles tendances, détecter la probabilité d’une maladie avant même que celle-ci ne se déclare… Tout cela devient possible et même précis grâce aux data scientists, ces spécialistes de la donnée numérique. Les profils de ces férus de chiffres et d’informatique sont encore peu nombreux mais très recherchés.

À travers son parcours, le chercheur Gaël Varoquaux, 37 ans, Data Scientist en imagerie cérébrale à l’Institut national de la recherche en informatique et automatique (Inria), nous éclaire sur les particularités de son métier.

Data Scientist… Sous cet intitulé un peu obscur, comment définis-tu ce métier ?

Le métier est apparu il y a une petite dizaine d’années seulement. La profession de Data Scientist a vu le jour avec la masse de données que permettent de collecter tous les équipements connectés. La mission du Data Scientist consiste à aller puiser dans ces données des informations qui permettent d’éclairer la connaissance, quel que soit le domaine. Ce peut être la finance, la bancassurance, l’e-commerce, mais aussi la recherche, avec des approches bien sûr différentes, selon le domaine d’activité vers lequel on s’oriente.

A la recherche d'un job de Data Scientist ?

Découvrez les dernières offres et postulez !

Voir les offres

La mission du Data Scientist consiste à aller puiser dans ces données des informations qui permettent d’éclairer la connaissance, quel que soit le domaine.

Comment es-tu devenu Data Scientist ?

Fils de professeur de maths, j’ai grandi avec les sciences et j’ai toujours été un peu geek. Lors de ma thèse de physique sur l’optique atomique, je me suis rendu compte que j’étais finalement plus passionné par la compréhension d’un mécanisme, la programmation et le traitement de données que par la physique en elle-même. Et l’étude du cerveau, très riche et complexe, m’attirait. Ce goût du traitement de données et ma compétence en programmation m’ont permis d’intégrer, en 2008, le centre de recherche NeuroSpin, à Saclay (Essonne), l’une des plus puissantes plates-formes d’acquisition de données de neuroimagerie en France. Au sein de l’équipe Pariétal, rattachée à l’Inria, notre mission consiste à exploiter ces données et leurs potentialités. Pour cela, nous mettons en place de nouvelles techniques d’analyse statistique et géométrique qui permettent de mieux décrire le cerveau, son fonctionnement, sa structure et sa variabilité.

image

Par exemple, sur quels types de projets es-tu amené à travailler ?

Récemment, nous avons été contactés par l’Institut Pasteur pour savoir si l’on pouvait présager un diagnostic d’autisme en regardant l’image du cerveau d’un individu. Dans la santé, les enjeux sont importants et nous devons prendre le maximum de précautions dans les méthodes que nous mettons en place. Car le danger dans notre métier, c’est de se mentir à soi-même, d’avoir une solution qui n’est utile qu’en laboratoire. Pour éviter cela, il nous arrive de solliciter une participation extérieure à travers des challenges ouverts à tous. Nous mettons en ligne une partie des données qui nous semblent suffisantes pour établir ce qu’on appelle “un modèle prédictif”. Puis, lorsque celui-ci nous paraît pertinent, nous le confrontons avec l’ensemble des données en notre possession. Cela nous permet ainsi d’obtenir un résultat le plus fiable possible. Pour ce projet, nous avons reçu la participation de 100 personnes issues du monde entier et obtenu des conclusions très encourageantes qui feront prochainement l’objet d’une publication scientifique.

Le danger dans notre métier, c’est de se mentir à soi-même, d’avoir une solution qui n’est utile qu’en laboratoire.

image

Qu’est-ce qui te plaît le plus dans ton métier ?

Beaucoup de choses, notamment celles liées au domaine d’application que j’ai choisi : l’imagerie cérébrale. J’apprécie le contact avec les spécialistes du cerveau et j’aime me dire que notre travail contribuera à améliorer la prise en charge des maladies psychiatriques. La technique, qui repose à la fois sur les maths et l’informatique, me passionne également. La donnée m’a toujours attiré, parce qu’elle m’apprend et me surprend. C’est elle qui nous permet de vérifier nos intuitions. Pour l’anecdote, un ami me disait récemment que davantage de bébés naissaient les jours de pleine lune. Je n’ai pas pu m’empêcher d’aller creuser du côté des données (registres de naissance, calendrier lunaire…). La conclusion est que cette idée est fausse.

La donnée m’a toujours attiré, parce qu’elle m’apprend et me surprend. C’est elle qui nous permet de vérifier nos intuitions.

A contrario, quels sont les inconvénients ?

Ce n’est pas vraiment lié au métier. Dans la recherche, et en tant que responsable d’une équipe de 20 personnes, la moitié de mon temps est consacrée à des tâches administratives qui peuvent être un peu rébarbatives. C’est la contrepartie pour exercer un travail qui me passionne. La rémunération est également moins attractive dans le public que dans le privé où les Data Scientists gagnent très bien leur vie. Mais je ne me plains pas, le salaire reste suffisamment correct pour vivre confortablement en famille à Paris.

image

Les Data Scientists sont des profils très recherchés sur le marché. Qui recrute ?

Ce sont souvent les grands groupes qui possèdent en interne leurs propres laboratoires de data science. Ce sont aussi les start-up, les prestataires conseil qui proposent leurs services à des PME ou encore les acteurs publics, comme dans mon cas.

Quels profils recherches-tu en tant que recruteur ?

Les formations de Data Scientists sont très récentes, donc trouver un candidat précisément formé au métier et qui possède de l’expérience est très rare et donc très cher. Personnellement, lorsque je dois recruter un Data Scientist, je recherche plutôt des personnes ayant suivi des études de sciences quantitatives (statistiques, mathématiques, physiques) et surtout agiles avec l’informatique. Avec un complément de formation, qui peut s’acquérir facilement à travers des MOOC ou en participant à des conférences ou des ateliers, elles peuvent rapidement devenir d’excellents Data Scientists. Pôle Emploi finance également des formations payantes dans ce domaine. Pour contrecarrer le cliché, un Data Scientist n’est pas nécessairement un jeune geek de 20 ans, et les femmes ont également toute leur place dans ce métier.

Un Data Scientist n’est pas nécessairement un jeune geek de 20 ans, les femmes ont également toute leur place dans ce métier.

image

Au-delà de la technique, quelles sont les qualités d’un(e) bon(ne) candidat(e) ?

La curiosité, une grande aptitude à saisir un problème, une certaine indépendance et une bonne capacité à communiquer, notamment avec des spécialistes du domaine d’application choisi.

Comment vois-tu le métier évoluer ces prochaines années ?

Je n’ai pas de boule de cristal mais il est certain qu’il va beaucoup changer. Le but étant de simplifier et d’automatiser au maximum le traitement des données, il est même possible que le métier de Data Scientist disparaisse à terme. Mais quand on exerce ce métier, c’est qu’on aime apprendre. Nous saurons faire autre chose. Plein de nouveaux métiers attendent les personnes agiles du clavier.

Photos by WTTJ

Retrouvez toutes les offres d’emploi de Data Scientist et de stage sur Welcome to the Jungle !