Rattaché(e) au service de la DSI, vous contribuez à la mise à jour de notre dictionnaire de données et participez également à l’étude et à l’éventuelle mise en place d’un outil de Data Catalog pour mieux organiser et gérer nos données.
Missions
1. Enrichissement et automatisation du dictionnaire de données
Extraction des métadonnées :
Collecter et analyser les métadonnées issues des schémas de bases de données PostgreSQL.
Automatiser l’extraction et la structuration des informations techniques (noms de tables, colonnes, types de données, relations, etc.).
Utilisation de l’IA pour enrichir les informations descriptives :
Développer des modèles basés sur le NLP (Natural Language Processing) pour générer ou suggérer des descriptions claires et complètes des tables et colonnes.
Utiliser l’IA pour identifier des relations implicites, suggérer des classifications ou catégoriser les données.
Automatiser le remplissage des champs descriptifs grâce à des algorithmes d’apprentissage supervisé ou non supervisé.
Vérification intelligente et mise à jour :
Implémenter des mécanismes pour détecter les incohérences dans les informations documentées.
Mettre en place des solutions pour garder le dictionnaire synchronisé avec les évolutions des schémas PostgreSQL.
Étude d’un outil de Data Catalog :
Analyser les besoins de structuration et d’accessibilité des données internes.
Évaluer les outils de Data Catalog disponibles sur le marché, et proposer une solution adaptée.
Collaboration avec les équipes internes :
Interagir avec les équipes métiers et IT pour garantir que le dictionnaire de données réponde aux besoins opérationnels.
Former et accompagner les équipes dans l’utilisation du dictionnaire enrichi.
2. Développement d’un outil d’IA pour la Lutte contre la Fraude
Analyse des besoins métiers :
Étudier les typologies de fraudes potentielles dans les filières optique, audio et dentaire.
Formaliser les cas d’usage autour de la détection de fraudes organisées en réseau.
Conception et développement d’une base graphe Neo4j :
Modéliser les relations complexes entre les entités pour détecter les réseaux frauduleux.
Développer une base graphe évolutive permettant une analyse des interactions et des comportements suspects.
Développement d’algorithmes d’intelligence artificielle :
Exploiter des algorithmes d’analyse de graphes (centralité, détection de communautés, recherche de motifs) pour identifier des patterns anormaux.
Intégrer des modèles de machine learning pour détecter les comportements atypiques et signaler les cas suspects.
Validation et amélioration :
Tester la solution sur des données réelles pour valider son efficacité.
Optimiser les modèles d’analyse pour améliorer les taux de détection tout en minimisant les faux positifs.
Documentation et transfert des connaissances :
Rédiger des rapports clairs sur la méthodologie et les résultats.
Partager les conclusions avec les équipes métiers et IT.
Bac+3 à Ba+5 en informatique, gestion de données ou systèmes d’information
Poste ouvert aux personnes en situation de handicap
Connaissances en bases de données relationnelles et en langage SQL
Connaissances des outils de gestion de données ou d’outils de Data Catalog
Connaissances en intégration et transformation des données
Maitrise de Microsoft Excel
Autonomie
Rigueur et sens de l’organisation
Capacité d’analyse et de synthèse
Bonne communication
Préqualification téléphonique
Entretien visio 30 min
Entretien physique 1h
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Voir toutes les offres