Stage R&D : Développement d’un outil d’optimisation de contenus pour les moteurs de recherches basés sur les Large Language Models (LLM)

Stage
Mérignac
Salaire : Non spécifié
Début : 28 février 2025
Télétravail occasionnel
Expérience : > 1 an
Éducation : Bac +5 / Master
Postuler

Oncrawl
Oncrawl

Cette offre vous tente ?

Postuler
Questions et réponses sur l'offre

Le poste

Descriptif du poste

  1. Analyse et conception :
    ○ Étudier les nouvelles tendances des moteurs de recherche basés sur les LLM.
    ○ Définir les métriques clés (spécificité, affinité, pertinence des questions) pour l’optimisation des contenus.
    ○ Identifier les sources de données exploitables (crawls, logs, Search Console).

  2. Extraction des questions pertinentes :
    ○ Analyser les contenus crawlés pour générer une liste de questions pertinentes via un modèle LLM.
    ○ Exploiter des embeddings pour calculer des distances sémantiques entre les questions et les contenus.
    ○ Utiliser des techniques d’apprentissage non supervisé (clustering) pour regrouper les contenus et questions similaires.

  3. Calcul et visualisation des métriques :
    ○ Mettre en place des algorithmes pour calculer l’affinité, la spécificité et la pertinence entre questions et contenus.
    ○ Créer des visualisations pour comparer ces métriques avec les performances mesurées dans la Search Console.

  4. Analyse croisée et recommandations :
    ○ Développer un module permettant de croiser les métriques d’optimisation avec les performances réelles issues de la Search Console.
    ○ Proposer des recommandations d’amélioration des contenus basées sur les résultats obtenus.

  5. Validation et documentation :
    ○ Tester les outils développés sur des sites échantillons.
    ○ Rédiger une documentation technique et une synthèse des résultats.


Profil recherché

Compétences recherchées :
● Solides compétences en traitement du langage naturel (NLP) et en modélisation LLM.
● Maîtrise des embeddings pour la représentation sémantique et le calcul de distances.
● Expérience en clustering et autres méthodes d’apprentissage non supervisé.
● Expérience avec des moteurs de recherche comme Elasticsearch, Vesp ou équivalents.
● Bonne compréhension des métriques et outils SEO.
● Capacité d’analyse, curiosité et autonomie.

Profil :
● Étudiant(e) en dernière année d’école d’ingénieurs, master en intelligence artificielle, data science ou équivalent.
● Intérêt pour les moteurs de recherche et les nouvelles technologies.

Envie d’en savoir plus ?

Postuler