Stage R&D : Développement d’un outil d’optimisation de contenus pour les moteurs de recherches basés sur les Large Language Models (LLM)

Internship
Mérignac
Salary: Not specified
Starting date: February 28, 2025
Occasional remote
Experience: > 1 year
Education: Master's Degree
Apply

Oncrawl
Oncrawl

Interested in this job?

Apply
Questions and answers about the job

The position

Job description

  1. Analyse et conception :
    ○ Étudier les nouvelles tendances des moteurs de recherche basés sur les LLM.
    ○ Définir les métriques clés (spécificité, affinité, pertinence des questions) pour l’optimisation des contenus.
    ○ Identifier les sources de données exploitables (crawls, logs, Search Console).

  2. Extraction des questions pertinentes :
    ○ Analyser les contenus crawlés pour générer une liste de questions pertinentes via un modèle LLM.
    ○ Exploiter des embeddings pour calculer des distances sémantiques entre les questions et les contenus.
    ○ Utiliser des techniques d’apprentissage non supervisé (clustering) pour regrouper les contenus et questions similaires.

  3. Calcul et visualisation des métriques :
    ○ Mettre en place des algorithmes pour calculer l’affinité, la spécificité et la pertinence entre questions et contenus.
    ○ Créer des visualisations pour comparer ces métriques avec les performances mesurées dans la Search Console.

  4. Analyse croisée et recommandations :
    ○ Développer un module permettant de croiser les métriques d’optimisation avec les performances réelles issues de la Search Console.
    ○ Proposer des recommandations d’amélioration des contenus basées sur les résultats obtenus.

  5. Validation et documentation :
    ○ Tester les outils développés sur des sites échantillons.
    ○ Rédiger une documentation technique et une synthèse des résultats.


Preferred experience

Compétences recherchées :
● Solides compétences en traitement du langage naturel (NLP) et en modélisation LLM.
● Maîtrise des embeddings pour la représentation sémantique et le calcul de distances.
● Expérience en clustering et autres méthodes d’apprentissage non supervisé.
● Expérience avec des moteurs de recherche comme Elasticsearch, Vesp ou équivalents.
● Bonne compréhension des métriques et outils SEO.
● Capacité d’analyse, curiosité et autonomie.

Profil :
● Étudiant(e) en dernière année d’école d’ingénieurs, master en intelligence artificielle, data science ou équivalent.
● Intérêt pour les moteurs de recherche et les nouvelles technologies.

Want to know more?

Apply