Dans un contexte où la transformation humaine des écosystèmes devient un enjeu de savoir majeur, mesurer et analyser les dynamiques passées qui modèlent le territoire aide à mieux saisir celles à l’oeuvre aujourd’hui. Pour saisir les dynamiques de peuplement, environnementales ou industrielles, les sciences sociales exploitent de plus en plus largement les fonds cartographiques anciens numérisés en masse par les institutions patrimoniales (ex. BnF) et cartographiques (ex. IGN). On s’intéressera ici tout particulièrement aux lieux nommés figurés dans les cartes à partir du XVIIe siècle par un pictogramme et accompagnés d’une étiquette : villes, moulins, villages, ports, forts, etc. Présents en très grands nombres, ce sont des témoins précieux de l’organisation démographique, (proto)industrielle, infrastructurelle, politique, religieuse ou encore militaire d’une région.
Pour ce stage, nous faisons l’hypothèse qu’un modèle de détection - pour les pictogrammes - et un modèle OCR - pour les étiquettes - peuvent bénéficier d’un couplage. La localisation des étiquettes et des pictogrammes est corrélée, le nom d’un lieu étant écrit à proximité de son pictogramme sur la carte. Le contenu du texte et la classe du pictogramme peuvent aussi être liés, par exemple une abbaye sera symbolisée par un pictogramme dédié et son labels contiendra souvent une référence à sa fonction, comme « A.B. », « Abb. » ou « Abbaye de …». Coupler ces deux modèles constituera un premier objectif du stage. Dans un second temps, on s’intéressera au liage des différentes extractions, afin de mettre en relation les pictogrammes détectés avec le label leur correspondant.
Missions :
Productions attendues :
étudiant ou étudiante, M2 ou ingénieur en 3ème année.
Sur le campus de l’Université Gustave Eiffel, accès facile par le RER A. Accès aux bibliothèques, au restaurant universitaire et au restaurant de l’entreprise.
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.