Stage BAC+5 - Data Science - Amélioration d'un outil de détection de plasmides - F/H/D

Stage(6 mois)
Lyon
Salaire : Non spécifié
Télétravail non autorisé
Expérience : > 6 mois
Éducation : Bac +5 / Master
Postuler

bioMérieux
bioMérieux

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

Les plasmides sont des éléments génétiques mobiles qui jouent un rôle important dans les capacités d’adaptations des bactéries. Ils représentent un vecteur clé de transferts horizontaux de matériel génétique. Leur étude par séquençage est par conséquent importante et leur distinction de la partie chromosomique d’un génome bactérien peut s’avérer difficile. Notre équipe travaille au développement de solutions de diagnostic innovantes, basées sur les technologies de séquençage haut débit (short et long reads) et, dans le cadre d’une solution d’épidémiologie, l’annotation du contenu séquencé en chromosome ou plasmide doit être réalisée de la manière la plus précise possible

L’objectif de ce stage est de contribuer à l’amélioration de l’annotation du contenu séquencé en plasmide en utilisant des méthodes à l’état de l’art. Les séquences plasmidiques présentent des spécificités : origine de réplication, éléments impliqués dans la mobilité, éléments transposables, séquences d’intégration. En fonction d’une espèce donnée, certaines spécificités peuvent être bien décrites, d’autres peu ou pas encore explorées. Pour améliorer l’annotation du contenu en plasmide, ces spécificités devront être étudiées pour une dizaine d’espèces, caractérisées et évaluées sur des jeux de données existants ou à définir.

Mots-clés : plasmide ; séquençage haut débit ; annotation de séquence ; génomique bactérienne ; épidémiologie


Profil recherché

Description du profil :

  • Vous êtes actuellement en dernière année de cycle ingénieur et préparez votre diplôme de niveau BAC+5, avec une spécialisation en Data Science ou en bioinformatique

Vos compétences:

  • Bonnes connaissances des méthodes d’analyses génomiques ou metagénomiques :
    • alignements et traitement des données alignées : blast, diamond, mummer, samtools, bcftools, hmmer, …
    • distance / containment : minhash, jaccard, …
  • Bonnes connaissances des langages scripts Python + librairies, bash et des environnement linux
  • Bonnes connaissances des bases de données usuelles en bioinformatique : refseq, genbank, uniprot, pfam, …
  • Capacité à lire des publications scientifiques écrites en anglais
  • Des connaissances en génomique bactérienne incluant des connaissances sur les plasmides, en bases de plasmides (PLSDB, …), en méthodes d’assemblages de génomes bactériens, sur Docker, sur des outils DevOps (CI/CD) ou encore sur le travail avec une grille de calculs sont fortement appréciées
  • Votre sens de l’autonomie, de la rigueur et votre curiosité scientifique vous permettent de mener avec réussite les missions qui vous sont confiées
  • Vous faites preuve d’aisance relationnelle et d’un sens de la communication vous permettant de travailler au sein d’un environnement pluridisciplinaire et international

Envie d’en savoir plus ?

D’autres offres vous correspondent !

Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.

Postuler