L’Institut national de l’information géographique et forestière (IGN) est un établissement public à caractère administratif placé sous la tutelle des ministères chargés de l’écologie et de la forêt. Sa vocation est de produire et diffuser des données (open data) et des représentations (cartes en ligne et papier, géovisualisation) de référence relatives à la connaissance du territoire national et des forêts françaises ainsi qu'à leur évolution.
Grâce à son école d’ingénieurs, l'ENSG-Géomatique, et à ses équipes de recherche pluridisciplinaires, l’institut cultive un potentiel d’innovation de haut niveau dans plusieurs domaines (géodésie, forêt, photogrammétrie, intelligence artificielle, analyse spatiale, visualisation 3D, etc.).
Contexte
L’observation de la Terre est un enjeu de plus en plus important. Dans un contexte où la transition écologique est devenue un enjeu national et international, l’Institut national de l’information géographique et forestière (IGN) s’est donné comme mission de cartographier le plus fréquemment possible l’anthropocène, autrement dit les évolutions et l’impact de l’activité humaine sur le territoire.
L’IGN réalise depuis 2018 des travaux IA pour l’automatisation des détections à partir d’images aériennes et satellites. Entre autres, un modèle IA ainsi qu’un large jeu d’apprentissage IA ont été construits pour répondre au besoin de création d’une couche d’occupation grande échelle (OCSGE) sur la France. De plus ces travaux ont été menés de façon ouverte et ont débouché sur la publication en open-data des résultats de détection, des modèles IA ainsi que des données d’apprentissages et
la création de deux défis IA : FLAIR #1 et FLAIR #2.
FLAIR #2 en particulier a exploré la multimodalité pour exploiter à la fois des données de type images aériennes (une seule image à très haute résolution, 20 cm) et des séries temporelles d’images satellitaires (résolution 10 m, plusieurs dizaines d’images sur une année).
Missions
Les retours sur l’utilisation des résultats des détections IA OCSGE soulignent un intérêt marqué pour le développement d’un modèle d’intelligence artificielle intégrant un plus grand nombre de classes que celles actuellement disponibles, notamment dans le domaine agricole (vignes, vergers, grandes cultures). Ces besoins s’alignent avec les priorités des travaux IA menés par l’IGN sur l’occupation du sol en lien avec l’agriculture.
Pour concevoir un modèle IA capable de distinguer ces classes agricoles spécifiques, il paraît essentiel de s’appuyer sur des séries temporelles d’images satellitaires (par exemple, pour les cultures comme le blé ou le maïs) pour distinguer les différentes phénologies et sur des images très haute résolution lorsqu’elles sont disponibles (notamment pour les vignes et les vergers). Ces exigences rejoignent directement les objectifs de recherche explorés dans le cadre du défi FLAIR #2 (datapaper).
L’objectif du stage est donc de tirer parti des travaux et des résultats obtenus lors du défi FLAIR #2 pour les adapter à une thématique agricole. Il s’agit de produire une première évaluation (baseline) d’un modèle dédié à la création d’une nouvelle couche d’occupation du sol spécifiquement agricole. Un alignement avec les couches décrivant l’occupation du sol précédemment obtenues sera exploré.
Dans le cadre de ce stage, l’étudiant intégrera une équipe projet du DAI, travaillant sur la détection de la couverture de sol par IA. Les missions de l’étudiant sont les suivantes :
- Prise en main technique : il s’agira dans un premier temps de se familiariser avec les données et codes déjà produits permettant l’entraînement de modèles IA de segmentation sémantique pour la description de la couverture du sol, puis de se mettre à jour sur les métriques décrivant leur fiabilité (par exemple, mIoU, covariance, etc.). Une exploration des données en format raster sur la couverture du sol produites par l’IA ainsi que sur les données du Registre Parcellaire Graphique (RPG, https://www.geoportail.gouv.fr/thematiques/agriculture) suivra et enfin la prise en main du jeu de données IA pour la tâche de baseline sera faite.
- Développement méthodologiques : il s’agira ensuite d’explorer les différentes approches de ré-entraînement, fine-tuning ou transfert learning afin d’obtenir un modèle décrivant la couverture du sol avec une composante majeure agricole.
Profil recherché
Formation initiale informatique, machine learning, géomatique. Niveau Bac+4/Bac+5.
- Maîtrise de Python et des framework PyTorch et Lightning ;
- Intérêt pour le traitement d’images, l’optimisation et les problématiques liées au big data ;
- Expérience en manipulation de l’information géographique.
Conditions particulières
Vous intégrerez l’équipe de l'IGN dédiée à l’innovation et à l’expérimentation (Département d’Appui à l’Innovation) de la Direction des Systèmes d’Information (DSI). Les développements seront faits de façon open-source sur un répertoire Github de l’IGN.
Il n'y a pas de déplacements prévus.
Atouts de l’environnement de travail
Les locaux de l’IGN sont placés à proximité du Bois de Vincennes, du métro ligne 1 et du RER ligne A.
L’IGN dispose de plusieurs associations sportives et culturelles qui permettent des échanges riches avec l’ensemble du personnel. Une cantine associative permet une restauration de qualité à un prix modéré (tarif préférentiel pour les stagiaires).
Contact
Pour tout renseignement complémentaire :
Anatol GARIOUD : anatol.garioud@ign.fr
Nicolas DAVID : nicolas.david@ign.fr
Aucune candidature envoyée à ces mails ne sera prise en compte.
Merci de postuler à cette offre en cliquant sur "Je postule"