Mise en relation de données hétérogènes pour le renforcement des systèmes de sécurité alimentaire – Cas de la production agricole en Afrique de l'Ouest / Hugo Deleglise ; sous la direction de Mathieu Roche et de Maguelonne Teisseire

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Sécurité alimentaire

Intelligence artificielle

Bases d'informations généralisées

Produits agricoles

Roche, Mathieu (1975-.... ; maitre de conférences en informatique) (Directeur de thèse / thesis advisor)

Teisseire, Maguelonne (Directeur de thèse / thesis advisor)

Mothe, Josiane (19..-.... ; enseignante-chercheuse en informatique) (Rapporteur de la thèse / thesis reporter)

Matwin, Stan (1949-....) (Rapporteur de la thèse / thesis reporter)

Gançarski, Pierre (1959-....) (Membre du jury / opponent)

Interdonato, Roberto (19..-....) (Membre du jury / opponent)

Université de Montpellier (2015-2021) (Organisme de soutenance / degree-grantor)

École Doctorale Information, Structures, Systèmes (Montpellier ; 2015) (Ecole doctorale associée à la thèse / doctoral school)

Territoires, Environnement, Télédétection et Information Spatiale (Montpellier) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Les progrès dans la lutte contre la faim ont été significatifs en Afrique de l’Ouest et au Burkina Faso entre 2000 et 2014, avant que la situation alimentaire ne se détériore. Les raisons sont multiples et interdépendantes : des phénomènes météorologiques extrêmes plus fréquents et l'augmentation de la population tendent à réduire la disponibilité alimentaire ; les déplacements de population dus aux conflits ont pour conséquence la chute de la production agricole et la désorganisation des circuits de distribution ; la pauvreté structurelle des populations est aggravée par un contexte économique mondial difficile. Pour suivre, analyser et prévoir les situations d'insécurité alimentaire, les systèmes de sécurité alimentaire (SSA) intègrent principalement des données agroclimatiques issues d’images satellites et des indicateurs de nutrition, de production et d’économie issus d’enquêtes ménages. Ces enquêtes sont essentielles à la production d’indicateurs clés pour mesurer la sécurité alimentaire (SA), mais sont coûteuses économiquement et en temps.L'objectif de cette thèse est de fournir des approches innovantes pour l’estimation d’indicateurs de SA et de leurs déterminants, en utilisant des données hétérogènes publiquement accessibles et des approches fondées sur l’intelligence artificielle, dans la perspective d'appuyer les méthodes utilisées par les SSA. Pour cela, plusieurs questions de recherche sont traitées : sur quels indicateurs s’appuyer pour mesurer la SA et quelles en sont les limites ? Comment traiter l’hétérogénéité thématique, temporelle et spatiale des données ? Comment extraire des éléments explicatifs à partir des données ? Pour répondre à ces problématiques, cette thèse propose trois contributions.Premièrement, nous faisons un état des lieux des nombreux indicateurs utilisés pour quantifier cette notion complexe qu’est la SA. Puis, nous nous concentrons sur des indicateurs de SA issus d’enquêtes ménages et étudions ce qu’ils nous révèlent sur la SA, leur validité spatiale et temporelle, ainsi que les biais auxquels ils peuvent être sujets. Nous montrons que malgré leurs biais inhérents, ces indicateurs contiennent des informations spatiales et interannuelles cohérentes qui peuvent être exploitées pour le suivi des crises alimentaires au niveau sub-national.Deuxièmement, nous proposons des approches originales combinant des méthodes d'apprentissage automatique et profond (i.e., forêts aléatoires, réseaux de neurones convolutifs, réseaux de neurones récurrents) pour obtenir des approximations d’indicateurs de SA issus d’enquêtes ménages. Ces approches intègrent et combinent des données explicatives hétérogènes. Les données explicatives sont des variables quantitatives (e.g., données météorologiques), des images (e.g., densités de population, occupation des sols) et des points GPS (e.g., hôpitaux, écoles, événements violents) avec différentes granularités spatio-temporelles. Nous mettons en évidence la pertinence des approches d'apprentissage automatique selon les données à traiter et constatons l’apport significatif de variables issues de domaines variés.Troisièmement, nous étudions l’apport des données textuelles, possédant un fort potentiel explicatif, pour effectuer une analyse qualitative de la SA en nous basant sur un corpus de journaux burkinabés. Nous examinons la capacité des méthodes de fouille de textes à extraire automatiquement des informations qualitatives sur la situation alimentaire globale, régionale et annuelle à partir de ce corpus. Ce travail a permis d'obtenir des informations qualitatives spécifiques sur la thématique de la SA et sur ses caractéristiques spatiale et temporelle.A travers ces trois contributions, cette thèse considère la problématique de l’hétérogénéité des données liées à la SA en mettant l’accent sur les dimensions spatio-temporelles et thématiques qu’elles véhiculent. Les cadres méthodologiques génériques proposés pourront être étendus et adaptés à d’autres domaines.

Résumé / Abstract : Progress in the fight against hunger was significant in West Africa and Burkina Faso between 2000 and 2014, before the food situation deteriorated again. The reasons are multiple and interrelated: more frequent extreme weather events and population growth tend to reduce per capita food availability; population displacements due to conflicts result in a drop in agricultural production and the disorganization of distribution channels; structural poverty of populations is aggravated by a difficult global economic context. To monitor, analyze and forecast food insecurity situations at local to sub-national scales, food security systems (FSS) mainly integrate agro-climatic data from satellite images and nutrition, production and economic indicators from household surveys. These surveys are essential for producing key indicators for measuring food security (FS), but are costly in terms of time and money.The objective of this thesis is to provide innovative approaches for the estimation of FS indicators and their determinants, using publicly available heterogeneous data and artificial intelligence-based approaches, with a view to supporting the methods used by SSA. To this end, several research questions are addressed: which indicators should be used to measure FS and what are their limitations? How to deal with the thematic, temporal and spatial heterogeneity of the data? How to extract the explanatory aspect of the data, i.e., to be able to identify the factors of increase or decrease of FS from the data? To address these issues, this thesis proposes three contributions.First, we review the numerous indicators used to quantify the complex notion of FS. Then, we focus on FS indicators derived from household surveys (i.e., the food consumption score, the household dietary diversity score, and the reduced coping strategies index) and study what they tell us about FS, their spatial and temporal validity, and the biases to which they may be subject. We show that despite their inherent biases, these indicators contain consistent spatial and inter-annual information that can be exploited for monitoring food crises at the sub-national level.Second, we propose novel approaches combining machine and deep learning methods (i.e., random forests, convolutional neural networks, recurrent neural networks with short-term and long-term memory) to approximate FS indicators from household surveys. These approaches integrate and combine heterogeneous explanatory data. The explanatory data are quantitative variables (e.g. World Bank economic variables, weather data), images (e.g. population densities, land use), GPS points (hospitals, schools, violent events, weather stations, markets) and vectors (rivers) with different temporal and spatial granularities (e.g. quantitative data, time series, high spatial resolution images). We highlight the relevance of machine and deep learning approaches depending on the data to be processed and note the significant contribution of variables from many domains in a global approach.Third, we study the contribution of textual data, with a strong explanatory potential, to perform a qualitative analysis of FS based on a corpus of Burkinabe newspapers. We examine the ability of text mining methods to automatically extract qualitative information on the global, regional and annual food situation from this corpus. This work has provided specific qualitative information on the theme of FS and its spatial and temporal characteristics.Through these three contributions, this thesis considers the problem of the heterogeneity of data related to FS by focusing on the spatio-temporal and thematic dimensions that they convey. The proposed generic methodological frameworks can be extended and adapted to other domains.