Bourses AMOPA
Une bourse de notre fédération nationale AMOPA
a été attribuée cette année
à un jeune Haut-Saônois : Nathan Wolff.
Lundi 18 janvier 2021, a eu lieu la remise d'une bourse AMOPA à Nathan WOLFF, de Fontaine-Lès-Luxeuil, actuellement
étudiant en deuxième année d’école d’ingénieur à l’ENSG (Ecole Nationale des Sciences Géographiques) sur le campus de Marne-la-Vallée. Celle-ci lui a été octroyée pour lui permettre d'effectuer un stage de 3 mois à Mantle Labs GMBH, une petite entreprise située à Vienne, en Autriche. Hélas vu les restrictions sanitaires dues à la COVID, son stage s'est réalisé uniquement en télétravail du 25 mai 2020 au 14 août 2020, un autre stage à l'étranger étant reporté d'un an. D'autre part,Nathan est lauréat du Trophée des étudiants-ambassadeurs de l'Ile-De-Frnce 2019-2020.
Le sujet du travail de Nathan fut « Yield forecasts using EO and weather data », que l’on peut traduire par « Prévision de rendements d’espaces agricoles par télédétection via l’utilisation de données satellitaires et météo ».
Voici ce que nous rapporte Nathan :
« La télédétection se base sur des traitements informatiques d’images satellites (couleur, infrarouge, RADAR) ou de nuages de points LiDAR*. Son objectif est de mettre en exergue de manière automatisée des phénomènes géographiques à grande échelle. »
* Le LiDAR est une technique de mesure de distance qui utilise de la lumière, quasiment toujours issue d’un laser, à la différence du radar qui emploie des ondes radio ou du sonar qui utilise des ondes acoustiques. C'est l'acronyme de l'expression en langue anglaise « light detection and ranging ».
« L'entreprise Mantle Labs est basée en Autriche et en Inde. Elle a vu le jour en 2018, suite à un besoin exprimé initialement par des entreprises indiennes. Celles-ci, majoritairement des corporations agricoles, puis des banques ainsi que des assurances, souhaitaient pouvoir connaître l’état des cultures indiennes passées, présentes et si possible à venir, afin d’orienter leurs investissements. Cependant, ces entreprises ne possédant aucune connaissance dans le domaine de la télédétection, Mantle Labs intervient en tant que fournisseur de données à valeur ajoutée. La mise en place d’outils de traitement satellitaires à grande échelle est devenue la mission principale de cette petite entreprise. Aujourd’hui, les bureaux situés à Vienne s’occupent de la partie technique (récupération des données, mise en exergue de phénomènes par segmentation/classification, santé des végétaux, occupation du sol etc...). Les bureaux indiens sont responsables de la partie commerciale (rencontre avec les clients etc...). Les travaux de Mantle Labs dépassent désormais le cadre de l’Inde seule. ( …)
Afin de communiquer avec l’équipe et mon maître de stage, j’ai utilisé la plateforme Slack. Grâce à cet intermédiaire j’ai pu être accueilli par l’équipe de Vienne à distance, profiter de leurs conseils et découvrir le travail de chacun. (...)
Afin d’améliorer la qualité des produits de Mantle Labs, il est nécessaire de continuer à explorer de nouveaux axes de de recherche. Il existe des cultures qui n’ont pas encore été évaluées, des algorithmes* plus efficaces à implémenter* etc... C’est ce besoin d’explorer de nouvelles pistes qui a décidé mon maître de stage à m’accepter comme stagiaire. »
* Un algorithme est une suite finie et ordonnée d’opérations ou d'instructions permettant de résoudre une classe de problèmes, d'obtenir un résultat ... Comme une recette de cuisine ! Dans le domaine de la technologie et de l’informatique, lorsqu’un développeur crée un programme, il crée en fait un ensemble d’algorithmes c'est-à-dire un ensemble de commandes données à la machine, écrites dans un langage spécifique, afin d’effectuer une série d’opérations spécifiques pour obtenir un résultat.
* Implémenter désigne le fait d’« effectuer l’ensemble des opérations qui permettent de définir un projet et de le réaliser, de l’analyse du besoin à l’installation et la mise en service du système ou du produit », définition très large qui couvre toute une suite d’opérations excepté la vente et la maintenance éventuelle dudit projet.
« Ma mission s’est donc concentrée sur une culture sensible : la vigne.
Le but était d’éprouver une méthode nouvelle de prévision de rendements sur les vignes autrichiennes et la production officielle de vin en Autriche. Les prévisions ne portaient que sur la quantité, et non la qualité, de vin produit. L'expérimentation est passée par le développement d’une chaîne de traitement complète aboutissant à des prédictions réalisées par machine learning*. Son caractère innovant se situait uniquement dans la préparation des données, plus précisément sur l’étape de "feature engineering"*, durant laquelle nous choisissons les indicateurs sur lesquels les prédictions s’appuieront par la suite. La partie machine learning est quant à elle tout à fait classique. Mon travail a donc été essentiellement technique (programmation Python).
* Le Machine Learning (de l'anglais ''learn'' : apprendre) est une technologie d’intelligence artificielle permettant aux ordinateurs d’apprendre par eux-mêmes, sans avoir été programmés explicitement à cet effet. Pour apprendre et se développer par eux-même, les ordinateurs ont besoin de données à analyser et sur lesquelles s’entraîner. Celles-ci proviennent du Big Data, qui est donc l’essence du Machine Learning. Concrètement le machine learning permet de découvrir des patterns* et d’effectuer des prédictions à partir de ces données en se basant sur des statistiques, sur du forage de données, sur la reconnaissances de patterns et sur les analyses prédictives. Les premiers algorithmes sont créés à la fin des années 1950. (Par exemple, l’algorithme Google DeepMind a récemment appris seul à jouer à 49 jeux vidéo Atari.)
De plus, contrairement aux outils analytiques traditionnels, le machine learning peut être appliqué aux ensembles de données croissants. Plus les données injectées à un système Machine Learning sont nombreuses, plus ce système peut apprendre et appliquer les résultats à des insights de qualité supérieure. Le Machine Learning permet ainsi de découvrir les patterns enfouies dans les données avec plus d’efficacité que l’intelligence humaine. Plus un système Machine Learning reçoit de données, plus il apprend et plus il devient précis.
*une ''feature''est une information supplémentaire potentiellement intéressante pour améliorer la pertinence d’une prévision.
Le ''Feature Engineering'' est l'art d' identifier les colonnes de données offrant les caractéristiques les plus utiles, distinguer les bonnes des mauvaises et les prétraiter et transformer afin d'optimiser leur efficacité dans les modèles.
* L'anglicisme ''pattern'' signifie ''patron''. Un pattern constitue une solution générique à un type de problème fréquemment rencontré, en décrivant et formalisant les concepts sous-jacents à cette solution. Il désigne, selon le contexte, un modèle, une structure, une organisation, un motif ou un type répétitifs auquel il peut conférer des propriétés caractéristiques. En programmation par exemple, il existe des pattern qui contiennent les grandes lignes nécessaires à la compréhension du fonctionnement d’une solution, qui sont par ailleurs directement modifiables et adaptables selon les besoins.
« L’Autriche est composée de 9 "Länder" (l’équivalent de nos régions en France), mais tous les Länder ne cultivent pas de vignes, le pays étant très montagneux à l’ouest. Je n'ai travaillé que sur les 4 Länder qui concentrent la totalité de la production viticole : Wien (la ville elle-même constitue à elle seule un Land), Burgenland, Niederösterreich (Basse-Autriche) et Steiermark. Les productions de vin sont disponibles pour chaque millésime à partir de 1978. Au vu des disponibilités des images satellites, nous avons utilisé les données des années 2002 à 2019. Nous avons donc 72 valeurs de production viticole de référence.
Dans notre expérimentation innovante, nous ne réaliserons pas de prédictions à l’échelle d’un vignoble ou bien d’un domaine viticole : le ''Land'' est notre unité spatiale. Les données satellites utilisées sont les images MODIS NDVI* décennales. Ces images encadrent l’Autriche dans un rectangle de 303 km (Nord-Sud) par 861 km (Est-Ouest) bordant ses frontières. (…). La résolution de ces images est kilométrique, cette étendue est donc couverte par des images de taille (303 lignes, 861 colonnes), un pixel représentant un carré d’un kilomètre sur un kilomètre. Quel que soit le Land étudié, nous nous intéressons toujours à la totalité des images, au-delà des frontières du Land en question. Cela signifie que pour prédire un rendement en Burgenland, un pixel situé au Tyrol est susceptible d’être mis à contribution.»
* NDVI est l'acronyme de Normalized Difference Vegetation Index : l'indice de végétation par différence normalisé ou indice de Tucker
Les valeurs du NDVI sont comprises en théorie entre -1 et +1, les valeurs négatives correspondant aux surfaces autres que les couverts végétaux, comme la neige, l'eau ou les nuages. Pour les sols nus, le NDVI présente des valeurs proches de 0. Les formations végétales quant à elles, ont des valeurs de NDVI positives, généralement comprises entre 0,1 et 0,7 - les valeurs les plus élevées correspondant aux couverts les plus denses.
« Deux questions peuvent se poser à ce stade : pourquoi avoir fait le choix d’une résolution faible, alors que des images plus précises existent ? Pourquoi s’intéresser à l’emprise totale des images quel que soit le Land étudié ? Ces deux questions, reliées, sont tout à fait légitimes. Intuitivement, prendre en compte les variations de NDVI au sommet des Alpes pour estimer le rendement des vignobles du Burgenland situé à plusieurs centaines de kilomètres à l’est, loin de toute montagne, ne semble pas des plus logiques. C’est justement cette réflexion initiale qui nous a poussé à essayer cette méthode. (…). Généralement les études dites "classiques" se concentrent sur des données locales, focalisées sur la zone où se situe le phénomène. Pour nous, l’idée est de vérifier si, finalement, un lien plus général entre différents écosystèmes, spatialement éloignés, n’existerait pas. Sa particularité réside dans la phase de préparation des données, une démarche innovante fondée sur la détection de pixels caractéristiques appelés "proxies".
Les méthodes de prévisions de rendements agricoles basées sur l’imagerie satellitaire sont nombreuses et se construisent autour d’approches machine learning diverses. Les approches expertes, qui consistent à rechercher les meilleurs critères influençant, positivement ou négativement, la qualité d’une récolte se concentrent sur des paramètres immuables, et inhérents à la culture elle-même. Par exemple si l’on désire suivre les vignobles, il est extrêmement important de suivre les conditions climatiques (gel et grêle), en particulier autour de la première floraison etc... Nous, au contraire, nous nous baserons sur un critère non immuable, valable uniquement sur un intervalle de temps donné, et qui peut s’appliquer à n’importe quelle culture (rappelons que cette méthode cherche à être très générale). Ce critère est ce que nous appelons pixels "proxy", ou bien "proxies". L’idée est de trouver les pixels qui semblent refléter le mieux, en terme de valeurs NDVI, les productions de vin au cours d’une période donnée (période de plusieurs années, par exemple 2002 à 2019) ; puis de ne se concentrer que sur ces pixels (quelque soit leur localisation), sensés être les plus "fiables" pour décrire l’évolution des rendements au fil des ans, et par conséquent pour construire nos prédictions. Par exemple un pixel qui présente des valeurs NDVI élevées lors des très bonnes années de productions, et des valeurs faibles lors des mauvaises années, pourra être un bon candidat au titre de "proxy". La corrélation entre les variations des valeurs NDVI qu’il affiche et les variations des rendements officiels au cours du temps est déterminante. (…) »
La conclusion est pourtant toujours la même : les prédictions ne suivent pas la réalité. Ces approches semblent trop "simples" pour être efficaces. Cela avait pourtant du sens de les éprouver. Dans le domaine de la prévision de rendements, la vérité terrain est très rarement disponible à petite échelle (champ, parcelle) : une méthode capable de s’adapter facilement à de grandes et différentes zones géographiques ainsi qu’à plusieurs cultures serait un très bon outil "passe-partout" qui pourrait permettre d’avoir des prédictions bonnes sans êtres excellentes dans de nombreux domaines. Il nous faut finalement reconnaître que nos approches sont trop générales. Je pense personnellement que l’idée des proxies situés à différents endroits est encore à creuser, il ne faut pas l’abandonner. Cependant je ne pense pas qu’il y ait encore un intérêt à n’utiliser que des données basiques (indice NDVI). Il faut étoffer la méthode, revenir en arrière, plus proche d’une approche experte. Nous répétons que cette approche est applicable à toute culture, mais nous n’avons évoqué que le vin jusqu’ici. Toutefois, nous avons réalisé, très brièvement vers le milieu du stage, un test sur le blé autrichien avec la première approche. Le blé est considéré comme plus aisé à prédire que la vigne. C’était un bon point de comparaison. Mais les résultats ont encore une fois été en dessous de nos attentes, bien que meilleurs que pour les vignes. Nous avons en effet atteint au mieux 10% d’erreur avec le blé, bien en-dessous des 20% obtenus avec les vignes.»
« J’ai réellement apprécié mon stage. Ces trois mois ont été instructifs et malgré la pandémie de Covid-19, très agréables. Il est toujours un peu décevant de développer une méthode qui n’aboutit pas à des résultats optimaux, mais je considère que c’est le rôle même de la recherche : il n’est pas possible d’avancer sans essayer toutes les pistes disponibles et sans avoir commis bon nombre d’erreurs. Comme mon maître de stage me l’avait justement fait remarquer, nous connaissons toujours les méthodes qui fonctionnent bien, mais nous n’entendons jamais parler de toutes celles qui les ont précédées, tous les essais infructueux qui sont répétés encore et encore par d’autres personnes qui n’en ont pas eu vent. J’espère que cette approche sera affinée, parce que sa grande flexibilité peut la rendre extrêmement utile et versatile. Au-delà de l’obtention de prédictions très précises, l’objectif principal est avant tout de caractériser l’efficacité cette démarche nouvelle. » J’espère que mon stage ne sera que la première étape. Personnellement, j’en garderai un excellent souvenir.»