L’IGN (Institut National de l’information géographique et forestière) produit diverses bases de données géographiques couvrant l’ensemble du territoire français ainsi que différentes cartographies permettant sa représentation. L’évolution technologique tant au niveau informatique, IA et sur l’évolution des capteurs aériens ou satellitaires a fortement augmenté les possibilités d’automatisation de la création de ces données géographiques. En particulier L’IGN dispose aujourd’hui de modèles IA (type segmentation d’images) entraînés pour faire des détections d’occupation du sol sur des images aériennes (et satellites) avec des résultats satisfaisant pour une utilisation en production. A noter que ces modèles IA sont également diffusés en open-data [1]
Depuis ces premiers travaux IA sur la thématique de l’occupation du sol [2], l’IGN poursuit le développement de modèles IA pour d’autres thématiques et besoins (détection de bâtiments, de haies, de vignes et verger..). Cela conduit donc à un besoin récurrent d’inférence de modèle IA sur des images aériennes ou satellitaires, que cela soit lors de l’élaboration d’un modèle IA pour calculer les métriques sur un ensembles de zones tests ou bien pour la production et diffusion des résultats de ces modèles IA [3] (à l’échelle d’un département français, soit 6000km² à des résolution images de 20cm). Or le code utilisé aujourd’hui à l’IGN pour ses productions montre ses limites en termes de flexibilité et de facilité pour déployer de nouveaux modèles IA et dépend de ressources GPU en concurrence avec d’éventuels besoins d’entraînement de modèles IA.
L’IGN souhaite donc étudier le prototypage d’un serveur d’inférence IA pour mieux répondre aux besoins cités ci-dessus. Celui-ci doit permettre de lancer des inférences IA sur de larges données images (aériennes ou satellitaires) de façon optimisée sur les ressources de calculs. De plus, ce prototype cherchera à être le plus possible agnostique du framework IA d’entraînement, cela nécessitera donc l’étude et la spécification d’un mode de packaging/déploiement après entraînement et validation des modèles geo-IA. Et enfin l’IGN souhaite en profiter pour étudier les différentes stratégies d’inférences possibles sur des données de types images aériennes ou satellitaires permettant de tirer parti de leur spécificité par rapport aux images naturelles.
[1] https://huggingface.co/IGNF
[2] IGN Intelligence artificielle pour la description de la couverture des sols https://www.youtube.com/watch?v=g1N1PL8j4MY
[3] Diffusion open-data des résultats de prédiction IA pour l’occupation du sol : https://cosia.ign.fr/
L’objectif du stage est de prototyper un service d’inférence de modèles geo-IA. Cela regroupe un ensemble de tâches constituant le coeur du besoin, pour obtenir une première version du prototype d’inférence, suivi de tâches pour étudier différentes améliorations du prototype.
Les tâches prioritaires et permettant d’obtenir une V0 du serveur d’inférence sont :
Une fois cette première version mise en place et si le temps le permet, l’IGN souhaite étudier, tout ou partie des évolutions possibles suivantes, cité par ordre de priorité :
Productions attendues :
[1] https://github.com/roboflow/inference
[2] https://onnx.ai/
[3] https://huggingface.co/docs/hub/en/gguf
[4] https://medium.com/@phillipgimmi/what-is-gguf-and-ggml-e364834d241c
[5] https://developer.nvidia.com/tensorrt
Développeur IA (BAC + 5 de préférence)
Les locaux de l’IGN sont placés à proximité du Bois de Vincennes, du métro ligne 1 et du RER ligne A.
L’IGN dispose de plusieurs associations sportives et culturelles qui permettent des échanges riches avec l’ensemble du personnel. Une cantine associative permet une restauration de qualité à un prix modéré (tarif préférentiel pour les stagiaires).
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.
Puteaux