Modèle géostatistique

Pour en savoir plus sur la façon dont la simulation géostatistique gaussienne a été implémentée dans ArcGIS, reportez-vous à la section d`aide comment les simulations géostatistiques gaussiennes fonctionnent. Le raccord se fait en définissant un modèle qui fournit le meilleur ajustement à travers les points. C`est-à-dire que vous devez trouver une ligne telle que la différence quadratique pondérée entre chaque point et la ligne est aussi petite que possible. C`est ce que l`on appelle l`ajustement des moindres carrés pondérés. Ce modèle quantifie l`autocorrélation spatiale dans vos données. L`image ci-dessous montre les semi-variances empiriques (points rouges) et le modèle qui représente le mieux les points (ligne bleue): J`ai été en passant par ce modèle dans un détail minutieux pour essayer de le recréer pour une variable de réponse Beta-distribué et une chose qui est déroutant moi est l`utilisation de la bêta pour décrire la moyenne de la distribution multivariée pour y. ai-je tort de penser que y signifie tout le processus gaussien? Si oui, je pensais que Beta était additif à y plutôt que de décrire sa distribution (comme il est pour les valeurs prévues). J`envisage le cas de l`ajout de coefficients de régression à ce modèle-je suppose qu`ils seraient ajoutés à bêta à MU égal. Cependant, cela ne modifierait que la partie du processus Gaussien du modèle et non la moyenne globale, correcte? Dans ce cas, les valeurs se stabilisent après environ 20 simulations. Dans de nombreux cas, au moins 100 constatations sont exécutées pour fournir des informations suffisantes pour déterminer la moyenne et les probabilités de dépassement d`une valeur de seuil. Un plus grand nombre de réalisations permet des degrés de certitude plus élevés dans les statistiques récapitulatives et les variables de sortie du modèle, mais nécessite plus de temps de calcul. GGS suppose que les données sont normalement distribuées, ce qui se produit rarement dans la pratique. Une transformation de score normale est effectuée sur les données afin qu`il suive une distribution normale standard (moyenne = 0 et variance = 1).

Les simulations sont ensuite exécutées sur ces données normalement distribuées, et les résultats sont retransformés pour obtenir une sortie simulée dans les unités d`origine. Lorsque le krigeage simple est effectué sur des données normalement distribuées, il fournit une estimation et une variance de krigeage qui définissent complètement la distribution conditionnelle à chaque emplacement dans la zone d`étude. Cela permet de dessiner des constatations simulées de la fonction aléatoire (la surface inconnue, échantillonnée) sachant seulement ces deux paramètres à chaque emplacement, et est la raison pour laquelle GGS est basé sur un modèle simple krigeage et des données normalement distribuées. Les emplacements de l`enquête dans une zone donnée peuvent être désignés comme des emplacements. À chaque endroit, il y a une prévalence ou une probabilité sous-jacente, le nombre d`individus ou de ménages échantillonnés et les résultats observés. Le modèle d`échantillonnage standard est alors binôme: les statistiques de la sortie fournissent une mesure de l`incertitude du modèle. Deutsch, C.V., et A. G. Journel.

1998. bibliothèque de logiciels géostatistiques GSLIB et guide de l`utilisateur. 2e éd. Oxford University Press, New York, pages 119 – 122. La simulation géostatistique génère des représentations multiples, tout aussi probables, de la distribution spatiale de l`attribut à l`étude. Ces représentations fournissent un moyen de mesurer l`incertitude pour les emplacements non échantillonnés pris tous ensemble dans l`espace, plutôt qu`un par un (mesuré par la variance de krigeage). En outre, la variance de krigeage est généralement indépendante des valeurs de données et ne peut généralement pas être utilisée comme mesure de précision d`estimation. D`autre part, la précision de l`estimation peut être mesurée en construisant des distributions de valeurs estimées pour des emplacements non échantillonnés à l`aide de plusieurs constatations simulées qui sont construites à partir d`un modèle simple Kriging à l`aide de données d`entrée normalement distribuées (c`est-à-dire données qui sont normalement distribuées ou qui ont été transformées à l`aide d`un score normal ou d`un autre type de transformation).