Un modèle prédictif maya
Étude de l'utilisation des Systèmes d'Information Géographique dans le cadre d'un projet archéologique multi-échelles
Page précédente Table des matières Page suivante

2. Drainage et fertilité

Les deux jeux de données de drainage et fertilité (présentés en Annexe 7 : carte locale du drainage et Annexe 8 : carte locale de la fertilité) sont relativement similaires, les valeurs ayant été établies à partir de la même carte des sols (Jenkin et al. 1976)⁠. L'indépendance conditionnelle risque de ne pas être respectée, mais utiliser un jeu de données comprenant les deux paramètres simultanément rendrait l'interprétation plus difficile, et en multipliant le nombre de classes réduirait la fiabilité. La conception d'un tel raster peut être effectuée de façon à ce que les paramètres soient reflétés par les valeurs, en considérant par exemple :

Nouveau raster = Raster fertilité + 10 * Raster drainage

Dans l'exemple précédent, la valeur 32 représente ainsi un drainage de classe 3 et une fertilité de classe 2. Il est en revanche toujours aussi difficile d'analyser la qualité des résultats, notamment au niveau des poids. Il est en effet raisonnable de penser que les poids pour la fertilité et le drainage seront meilleurs pour les classes de bonne qualité que pour les autres, et organisés de façon décroissante : un contrôle immédiat est donc possible pour valider leur pertinence ou identifier un éventuel problème.

Dans le cas d'une image raster regroupant les deux paramètres, un tel contrôle s'avère difficile : comment prédire en effet si un drainage de classe 3 et une fertilité de classe 2 s'avèrent meilleurs qu'un drainage de classe 2 et une fertilité de classe 3 ? Les intuitions a priori et les analyses a posteriori ne s'avèrent donc pas si aisées.

3. Pente topographique

Le jeu de données de pente topographique utilisé dans le passé était constitué d'une image raster ayant un pixel de 50 m. Un nouveau fichier créé à partir des données SRTM niveau 2 est désormais disponible, ayant un pixel de 30 m. Cette différence est importante à l'échelle considérée afin de rendre correctement le relief en respectant la taille des sites comme le montrent les illustrations 9 et 10 au niveau de la même zone (les fortes pentes sont en blanc, les faibles en noir).

Illustration 9: Pixel de 50 m
Illustration 10: Pixel de 30 m

La pente considérée sera donc cette fois celle ayant un pixel de 30 m, ce qui devrait améliorer le modèle grâce à des données plus adaptées à l'échelle étudiée. Il est en effet possible de constater qu'avec un pixel trop important certains sites se trouvent dans des classes différentes de la réalité : la taille de pixel d'un paramètre ne devrait pas être beaucoup plus grande que celle des objets étudiés, de même qu'il n'est pas souhaitable qu'elle soit beaucoup plus petite (les sites étant alors localisés sur plusieurs classes du même paramètre).

Le relief apparaissant très varié au niveau de la zone d'étude (pente de 0% à 101%), ce paramètre pourrait avoir une grande importance.

C. Mise en application de la méthode

1. Introduction

La démarche mise en place dans cette partie consiste à entraîner le modèle au moyen de divers jeux de points (dont celui utilisé dans le passé) et de plusieurs masques afin d'identifier les différences pouvant apparaître. Cet exemple réalisé avec le projet archéologique étudié vise à présenter des pistes pour augmenter la fiabilité des résultats, en s'appuyant sur les conseils donnés pour l'utilisation d'ArcSDM et en montrant en quoi la mise en application n'est pas si évidente et comment y remédier.

2. Présentation des sites et des masques

Trois masques présentés en Annexe 6 : masques utilisés à l'échelle locale vont être testés. Dans tous les cas, la zone finale de calcul des probabilités (zone d'étude) sera celle couverte par le masque local. Ces trois masques seront désignés de la façon suivante :

Les sites utilisés au niveau du masque des transects sont ceux ayant servi dans le passé (Sirjean 2003; Monthus 2004)⁠ pour l'entraînement du modèle, mais le jeu de points d'entraînement n'est pas exactement le même : une sélection aléatoire avait été utilisée, mais non sauvegardée. Les points disponibles au niveau des autres transects sont ajoutés à ceux-ci, de même que des points dont l'étendue des levers n'est pas connue, ce qui donne un total de 1027 sites au niveau du masque local.

Lors des travaux passés, l'aire de la cellule unitaire considérée était de 0,01 km². La réduction du jeu de points à un site par cellule unitaire élimine plus de 40% des sites dans ce cas (1027 sites à l'origine, dont 615 seulement peuvent être utilisés), ce qui pourrait signifier un sur-dimensionnement. Or, il apparaît que les sites sont majoritairement d'une taille inférieure à 20 m, et séparés l'un de l'autre d'environ la même distance au minimum. Pour cette raison, il a été décidé de réduire la cellule unitaire à 0,0016 km² : la réduction retire dans ce cas 7% des sites, cette taille est donc plus pertinente.

Il est à noter que comme précédemment expliqué les sites sont séparés en deux jeux, l'un servant à contrôler l'efficacité de la prédiction, l'autre à entraîner le modèle. Les points servant à l'entraînement pour le masque des transects et le masque cover sont extraits de ce dernier. Les probabilités finales seront cependant calculées en utilisant l'ensemble des sites « réduits » afin qu'elles soient valides, et utilisables pour des calculs de densités. La Table 1 présente la liste des fichiers shapefile résultants de cela. Les sites servant à tester l'efficacité de la prédiction sont toujours les mêmes pour pouvoir réellement comparer : 25% des points sont réservés pour cela.

DescriptionFichier associéNombre de sites
Tous les sitessites_all.shp1027 sites
Sites « réduits »s_a_all.shp954 sites
Sites d'entraînement locals_a_tra.shp716 sites
Sites de prédictions_a_pre.shp238 sites (25% des sites)
Sites d'entraînement covers_c_tra.shp452 sites
Sites d'entraînement transects_t_tra.shp247 sites
Table 1: description des jeux de sites
css Copyright © 2018 Sébastien Merlet (Sebeto) xhtml