Analyse et conception :
○ Étudier les nouvelles tendances des moteurs de recherche basés sur les LLM.
○ Définir les métriques clés (spécificité, affinité, pertinence des questions) pour l’optimisation des contenus.
○ Identifier les sources de données exploitables (crawls, logs, Search Console).
Extraction des questions pertinentes :
○ Analyser les contenus crawlés pour générer une liste de questions pertinentes via un modèle LLM.
○ Exploiter des embeddings pour calculer des distances sémantiques entre les questions et les contenus.
○ Utiliser des techniques d’apprentissage non supervisé (clustering) pour regrouper les contenus et questions similaires.
Calcul et visualisation des métriques :
○ Mettre en place des algorithmes pour calculer l’affinité, la spécificité et la pertinence entre questions et contenus.
○ Créer des visualisations pour comparer ces métriques avec les performances mesurées dans la Search Console.
Analyse croisée et recommandations :
○ Développer un module permettant de croiser les métriques d’optimisation avec les performances réelles issues de la Search Console.
○ Proposer des recommandations d’amélioration des contenus basées sur les résultats obtenus.
Validation et documentation :
○ Tester les outils développés sur des sites échantillons.
○ Rédiger une documentation technique et une synthèse des résultats.
Compétences recherchées :
● Solides compétences en traitement du langage naturel (NLP) et en modélisation LLM.
● Maîtrise des embeddings pour la représentation sémantique et le calcul de distances.
● Expérience en clustering et autres méthodes d’apprentissage non supervisé.
● Expérience avec des moteurs de recherche comme Elasticsearch, Vesp ou équivalents.
● Bonne compréhension des métriques et outils SEO.
● Capacité d’analyse, curiosité et autonomie.
Profil :
● Étudiant(e) en dernière année d’école d’ingénieurs, master en intelligence artificielle, data science ou équivalent.
● Intérêt pour les moteurs de recherche et les nouvelles technologies.