QUI SOMMES-NOUS ?
Construisons ensemble un avenir de confiance
Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.
Nos engagements, vos avantages
Dans ce cadre nous recherchons un :
STAGE – Ingénieur recherche Apprentissage statistique pour le Traitement du signal audio (H/F) – 6 mois Basé à Palaiseau (91)
QUI ETES-VOUS ?
Vous vous reconnaissez ? Alors découvrez vos futures missions !
CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :
Thales SIX & GTS France est numéro un européen des systèmes d’information et de communication sécurisés pour les marchés de la défense, de la sécurité et du transport terrestre. Au sein de cette entité, ThereSIS, basé à Palaiseau et Gennevilliers, est un département de recherche comportant six laboratoires (Simulation, Intelligence Artificielle, Computer Vision, Signal radio, Cybersécurité et Data Science) lui permettant de répondre aux besoins amonts de Thales SIX GTS France et plus généralement de Thales.
Les réseaux de neurones profonds présentent les performances à l'état de l'art sur de nombreuses tâches liées traitement du signal comme par exemple en reconnaissance vocale, reconnaissance de locuteur, codage de la voix, séparation de sources.
Ces algorithmes sont particulièrement intéressants pour leur généricité, leur flexibilité et leur potentielle robustesse aux conditions d'acquisition.
La mise en œuvre canonique de ces algorithmes passe par une phase d'apprentissage supervisée durant laquelle les paramètres des réseaux de neurones sont réglés pour accomplir au mieux la tâche cible sur une base de donnée annotée constituée de paires données d'entrée - résultat à obtenir.
L'hypothèse sous-jacente de cette démarche est l'existence d'une grande base de données annotées représentatives de la tâche visée.
Or en pratique :
- La collecte de données est coûteuse et peut se heurter à des problématiques de copyright ou de droit des personnes,
- La distribution des configurations possibles n’est pas maitrisée lors de la collecte de données
- Les données d'apprentissage sont une approximation des données opérationnelles
- Les données représentatives du cas d'usage ne sont pas connues a priori ou évoluent au cours du temps.
Ici nous faisons l’hypothèse qu’un volume de données important est disponible pour une phase d’entrainement mais que ces données ne sont a priori pas totalement représentatives du cas d’usage et que des données représentatives ne seront disponibles que dans la phase d’exploitation de l’algorithme.
L’objectif du stage est de concevoir et d’évaluer des algorithmes capables de se reconfigurer sur un cas d’emploi, à partir d’un petit volume de données observées sur le terrain et sans relancer de phase d’entraînement.
Un premier cas d’application serait l’amélioration de la qualité d’enregistrements vocaux. Lors d’un enregistrement divers éléments viennent sur superposer à la voix (bruits) ou la distordre (échos, saturations). Si on peut simuler des données représentatives dans un certain nombre de situations théoriques, nous disposons de peu de données pour des situations d’intérêt critique (par exemple cockpit d’un véhicule).
Nous chercherons à concevoir un algorithme de type réseau de neurone profond configurable, qui fonctionne en deux modes :
- Un mode configuration qui prend en entrée un ou quelques extraits de signaux représentatifs de la situation d’intérêt, qui en extrait automatiquement de la connaissance et distille cette connaissance dans le réseau de neurones.
- Un mode inférence / production, postérieur au mode configuration pour exploiter l’information extraite le mieux possible pour la réalisation de la tâche
Les cas pratiques pour mettre en œuvre ces algorithmes seront dans un premier temps issus du traitement du signal audio (restauration, reconnaissance vocale).
Dans ce contexte, vos missions seront les suivantes :
Thales s’engage pour l’emploi et l’insertion des personnes en situation de handicap. A ce titre, notre établissement Thales Research&Technology France est reconnu Organisme Handi-Accueillant
Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.
Thales reconnait tous les talents, la diversité est notre meilleur atout. Postulez et rejoignez nous !Ces entreprises recrutent aussi au poste de “Ingénierie matérielle”.
Carrières-sur-Seine