✊ Nous avons construit une première version de notre méthode d'anonymisation des données et cherchons à traiter des volumes de données plus importants (100 Gb - 1 Tb), diversifier les sources de données tant dans leur type (génétique, géolocalisation, etc.) que dans leur origine (base de données relationnelles, flux tels que Kafka, etc.).
🤓 Nous sommes une équipe motivée par l'envie d'apprendre et de se confronter à des problématiques techniques complexes pour lesquelles il n'y a pas de solutions existantes.
⚙️ Notre stack et nos process ne sont pas encore bien définis : rejoins-nous pour nous aider à les mettre en place ! Compte tenu du contexte technique nous nous appuyons beaucoup sur Python (notamment pour ses librairies data : pandas, numpy, etc.).