L’exploration de nouvelles voies : La géostatistique, le Deep Learning et l’Imagerie Hyperspectrale au service de la gestion des sites et sols pollués

Dans un monde en constante évolution, la recherche environnementale ne cesse de repousser les frontières de la connaissance. Dans cet article, nous avons le privilège de vous présenter le travail d’un doctorant de chez Tellux, Herbert Rakotonirina, qui partage avec nous les tenants et aboutissants de sa thèse. Co-financée par Tellux et l’agence de transition écologique ADEME, cette recherche explore l’intégration de l’imagerie hyperspectrale dans la fusion de la géostatistique et du Deep Learning afin de mieux appréhender les défis associés à la pollution des sites et des sols. Découvrez comment ces technologies innovantes ouvrent de nouvelles perspectives pour la géologie environnementale.

T : Peux-tu nous présenter brièvement ta thèse chez Tellux ? Quel est le sujet principal de ta recherche ?

HR : Je réalise une thèse co-financée par Tellux et l’agence de transition écologique ADEME, et codirigée par Paul HONEINE, Olivier ATTEIA et Antonin VAN EXEM. Je suis rattaché au laboratoire LITIS de l’université de ROUEN. La thèse porte sur la géostatique, plus précisément sur la géostatistique par apprentissage profond (ou Deep Learning) sur les données d’imagerie hyperspectrale appliquée aux sites et sols pollués.

T : Peux-tu expliquer en termes simples ce que la géostatistique et le Deep Learning signifient pour les personnes qui ne sont pas familières avec le domaine ?

HR : La géostatistique est un ensemble de méthodes et un formalisme mathématique qui permettent de décrire quantitativement des phénomènes présentant une variabilité spatiale et/ou temporelle à partir de données géoréférencées. En d’autres termes, l’objectif de la géostatistique est de fournir une estimation des valeurs pour chaque point de l’espace à partir des valeurs ponctuelles connues, ce qui permet de créer une carte représentant la distribution spatiale de la variable d’intérêt. 

Le Deep Learning est une méthode d’apprentissage automatique qui s’inspire du fonctionnement du cerveau humain pour résoudre des problèmes complexes, grâce à des réseaux de neurones artificiels. Il est, par exemple, utilisé pour reconnaître des objets dans des images, traduire des langues, diagnostiquer des maladies, conduire des voitures et bien plus encore.

Figure montrant à gauche les valeurs ponctuelles connues, et à droite la carte estimée en utilisant une méthode géostatistique.
Figure montrant à gauche les valeurs ponctuelles connues, et à droite la carte estimée en utilisant une méthode géostatistique.

T : Pourquoi faire de la géostatistique par Deep Learning ?

HR : La méthode la plus utilisée en géostatistique dans le contexte des sites et sols pollués est le krigeage. Le krigeage est un outil statistique qui permet de cartographier une variable en se basant sur la façon dont les valeurs connues évoluent en fonction de leur distance spatiale. Malheureusement cette méthode comporte des limites lorsqu’il s’agit de l’appliquer dans le domaine des sites et sols pollués, notamment en raison du champs d’application : le sol qui présente une hétérogénéité susceptible d’être importante en raison de sa formation ou des impacts structurels (remblais) ou chimique (contamination) des activités humaine passées, ce qui peut compliquer la modélisation. De plus, elle peut nécessiter une capacité de calcul importante, particulièrement lorsque l’on travaille en trois dimensions. Nous avons opté pour l’utilisation du Deep Learning comme une alternative en réponse à ces contraintes. 

De plus, la méthode d’analyse de carottes par imagerie hyperspectrale utilisée par Tellux permet d’avoir une plus grande quantité d’informations sur les concentrations en hydrocarbure du sous sol (donc une meilleure compréhension de l’hétérogénéité des sols) en comparaison avec les diagnostics actuels basés sur des prélèvements ponctuels.

T : Pourquoi cette méthode n’a pas encore été appliquée dans le domaine des Sites et Sols Pollués ?

HR : L’utilisation du Deep Learning dans le domaine des SSPs présente aussi des contraintes. La principale étant le manque de données réelles. 

Le fonctionnement du Deep Learning est basé sur l’apprentissage à partir des données existantes. L’idée est de montrer plusieurs exemples à la machine pour qu’elle puisse faire la tâche automatiquement. Dans notre domaine, les cartes des sols pollués sont créées en interpolant les données issues des analyses en laboratoire des échantillons de sol. Par conséquent, il n’existe pas de carte qui reflète la pollution réelle du sol mais plutôt des estimations basées sur les valeurs observées. Ce qui implique l’absence de données pour entraîner un algorithme en Deep Learning. 

L’usage du Deep Learning est aussi plus adapté aux données d’imagerie hyperspectrale obtenues par Tellux. En effet, la technologie HyperScan qu’elle a développée génère des images à haute résolution de la concentration en hydrocarbure contenue dans les carottes, ce qui permet d’enrichir les données et d’avoir une meilleure cartographie de la pollution. Le Deep Learning (en particulier les réseaux de neurones), se démarque par sa capacité à traiter de vastes quantités d’informations.

T : Et comment gères-tu le problème lié au manque de données réelles pour entraîner ton réseau de Deep Learning  ?

HR : Les dernières avancées ont révélé que les réseaux de neurones en Deep Learning sont capables d’apprendre sans nécessiter d’apprentissage en amont. Plus spécifiquement, dans le domaine de la reconstruction d’images (où l’objectif est d’estimer les zones manquantes d’une image), des chercheurs ont démontré qu’il était possible d’accomplir cette tâche sans avoir à exposer la machine à de multiples exemples. Nous nous sommes donc inspirés de cette méthode pour adapter le Deep Learning à notre contexte.

T : Quelles sont les applications pratiques de tes recherches  ? Qu’apportent ces travaux à Tellux ?

HR : Étant donné que nous avons traité les contraintes liées aux manques de données, la méthode que nous proposons dans le cadre de cette thèse peut être utilisée dans les différentes applications de la géostatistique. Ces applications peuvent être : anticiper la qualité de l’air dans différentes régions, gérer efficacement les ressources naturelles en tenant compte de leur distribution géographique, élaborer des cartes détaillées des types de sols ou de végétation dans une zone, et bien d’autres encore.

Tellux, en utilisant une combinaison innovante de l’imagerie hyperspectrale et de l’intelligence artificielle, transforme les images de carottes de sols en un tableau de concentration en hydrocarbure. La méthode géostatistique proposée dans le cadre de la thèse est utilisée pour réaliser une cartographie en 3 dimensions de la pollution à partir des résultats du traitement par imagerie hyperspectrale de Tellux. Comme pour les autres  méthodes géostatistiques, la méthode par Deep Learning que nous proposons pendant cette thèse fournit aussi la carte de l’incertitude qui accompagne les estimations. Cette carte permet aux acteurs de  mieux interpréter les estimations, ce qui permet donc à Tellux de proposer une estimation des volumes de terres à traiter.

T : Peux-tu nous donner un aperçu de tes découvertes ou résultats préliminaires ?

HR : La méthode de cartographie par Deep Learning a été présentée lors du congrès GRETSI 2023. L’article est publié ici.

Un autre article est en cours de reviewing après correction dans un journal à comité de lecture, ce dernier présente les méthodes de calcul d’incertitude et de probabilité de dépassement de seuil.

IMG 0624

Herbert Rakotonirina
Diplômé d’un Master of Science en Informatique à Supinfo International University
Doctorant en géostatistique (ADEME/Tellux/LITIS) depuis octobre 2021

Vous souhaitez en savoir plus ?