QUI SOMMES-NOUS ?
Construisons ensemble un avenir de confiance
Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d’activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l’environnement et plus inclusif. Le Groupe investit près de 4 milliards d’euros par an en Recherche & Développement, notamment dans des domaines clés de l’innovation tels que l’IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays.
Nos engagements, vos avantages
- Une réussite commune portée par notre culture et excellence technologique, votre expérience et notre ambition partagée
- Un package de rémunération attractif (épargne salariale, variable ou 13ième mois selon les postes, restaurant d’entreprise,…)
- La possibilité de développer vos compétences en continu grâce à nos parcours de formation et nos académies internes #ENTREPRISEAPPRENANTE
- Notre attention portée à votre équilibre personnel et professionnel (Accord télétravail, RTT, congés d’ancienneté, jours enfants malades, guide parentalité, crèches, CSE / ASC,… )
- Des communautés internes permettant de vous engager sur les sujets qui vous tiennent à cœur : innovation, diversité, environnement
- Un environnement inclusif et bienveillant où vous êtes accueilli et valorisé avec notre politique handi-accueillante, notre charte LGBT+, notre initiative #StOpe pour lutter contre le sexisme.
Situé sur le campus de l’École polytechnique, au cœur du pôle scientifique et technologique d’envergure mondiale de Paris-Saclay, à Palaiseau, Thales Research & Technology (TRT) France constitue le centre de recherche et technologies français du Groupe Thales, au service des activités mondiales de Thales. Grâce à une politique de partenariat proactive avec le monde académique et un réseau international d’entreprises innovantes, le rôle des équipes de Thales Research & Technology est de proposer aux différentes entités opérationnelles du groupe Thales des innovations de rupture qui seront aussi des différenciateurs techniques ; de maintenir et d’accroître l’avance technologique de ces solutions mais aussi d’en assurer la compétitivité. Les activités de TRT France se situent aussi bien dans le domaine Hardware (Electronique, Optronique, Radiofréquences, semi-conducteurs, science des matériaux etc.), qu’en Algorithmie et Software (Intelligence Artificielle, Big Data, Cybersécurité, Aide à la décision, Optimisation etc.) et en Systèmes (conception architecturale, processus et outils). Thales Research & Technology rassemble plus de 250 ingénieurs de recherche, une 30aine de doctorants ainsi que chaque année, plus d’une soixantaine de stagiaires et de nombreux coopérants. Rejoignez l’aventure !
Dans ce cadre nous recherchons un :
STAGE – Ingénieur en Classement ELO des actions en apprentissage par renforcement (H/F) – 6 moisBasé à Palaiseau (91)
QUI ETES-VOUS ?
- Etudiant en Ecole d’Ingénieur ou formation équivalente, vous préparez un master 2 avec une spécialisation en intelligence artificielle ?
- Vos études et vos éventuelles expériences vous ont permis d’acquérir des connaissances solides dans les domaines suivants :
- Programmation Python
- Gestionnaire de version git
- Apprentissage par renforcement « value-based », tabulaire ou profond
- Vous disposez idéalement de compétences en :
- Open AI gym ou gymnasium
- Intelligence artificielle symbolique
- Vous faites preuves de curiosité, raison qui vous pousse à faire votre stage en recherche ?
- Enfin vous êtes à l’aise en français et en anglais ?
Vous vous reconnaissez ? Alors découvrez vos futures missions !
CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :
Le stage se déroulerait au sein du Laboratoire Raisonnement et Analyse dans les Systèmes Complexes de Thales Research & Technology, à Palaiseau.
Le classement Elo est utilisé pour ordonner les joueurs d’échec en fonction de leur niveau propre. Ce classement repose sur l’attribution de points, à chaque confrontation, au regard de l’estimation de succès ou d’échec supposé par son niveau courant. Après un certain nombre de confrontations, le niveau de chaque joueur s’établi et se stabilise.
Nous développons un algorithme d’apprentissage par renforcement pour lequel la politique de décision est un modèle décisionnel déclaratif (sous forme de règles). La mise à jour de la politique repose sur une mesure de qualité des associations états/actions. On peut voir le choix d’une action pour un état donné durant l’apprentissage comme une confrontation entre l’agent apprenant et l’environnement.
L’objectif de ce stage consiste à étudier l’intérêt d'un classement Elo des actions permettant la mise-à-jour de la politique de manière agnostique au problème d'apprentissage.
Dans ce contexte, vos missions seront les suivantes :
- Appréhender rapidement la méthodologie du classement Elo
- S'approprier l'algorithme existant, et plus généralement les algorithmes d'apprentissage par renforcement dits "value-based"
- Identifier et mettre en œuvre un moyen d'utiliser ce classement comme mesure de qualité des associations états/actions.
- Etudier l'effet sur la performance de l'apprentissage et la qualité de la politique apprise.
- Etudier la possibilité d'utiliser ces informations de classement dans l'exploration de l'espace d'apprentissage.
- Proposer des perspectives
- Présenter les résultats
- Rédiger un rapport de synthèse
Thales s’engage pour l’emploi et l’insertion des personnes en situation de handicap. A ce titre, notre établissement Thales Research&Technology France est reconnu Organisme Handi-Accueillant
Tous nos stages sont conventionnés et soumis à une gratification dont le montant est déterminé selon votre niveau d’études.
Thales reconnait tous les talents, la diversité est notre meilleur atout. Postulez et rejoignez nous !