LE KRIGEAGE : LA MÉTHODE OPTIMALE DINTERPOLATION SPATIALE
Nous présentons une introduction informelle à la méthode destimation (interpolation) spatiale connue sous le nom de Krigeage. La notion de variogramme est introduite et discutée. La supériorité du Krigeage est illustrée à laide dun exemple simple.
Mots clés : Krigeage, géostatistiques, analyse objective, interpolation spatiale, interpolation optimale, interpolation de Gauss-Markov.
1. INTRODUCTION
Lobjectif de cet article est de présenter informel- lement les principes de la méthode dinterpolation spatiale connue sous le nom de " Krigeage ". Le Krigeage est la méthode optimale, au sens statistique du terme, destimation. On peut lutiliser autant pour linterpolation que lextrapolation. Ici nous nous restreindrons à linterpolation et lextrapolation spatiales en deux dimensions. Le Krigeage porte le nom de son précurseur, lingénieur minier sud-africain D.G. Krige. Dans les années 50, Krige1 a développé une série de méthodes statistiques empiriques afin de déterminer la distribution spatiale de minerais à partir dun ensemble de forages. Cest cependant le français Matheron2 qui a formalisé lapproche en utilisant les corrélations entre les forages pour en estimer la répartition spatiale. Cest lui qui a baptisé la méthode " Krigeage ". Il a aussi été le premier a utiliser le terme " géostatistiques " pour désigner la modélisation statistique de données spatiales. Les mêmes idées ont été développées parallèlement en URSS par L.S. Gandin3. Gandin a baptisé sa méthode " interpolation optimale ". Il a introduit la notion d" analyse objective " pour décrire cette approche basée sur les corrélations. Cest le nom sous lequel la méthode est connue en météorologie. En océanologie, la méthode a été introduite par Bretherton et al.4 et elle est connue sous le nom de " méthode dinterpolation de Gauss-Markov ", daprès le nom quon lui donne formellement dans les livres de statistiques (voir Liebelt5, par exemple). Dans les prochaines sections, nous présenterons une description du variogramme, le cur du Krigeage. Suivront une présentation du Krigeage ordinaire, un exemple illustrant la supériorité de la méthode, ainsi que la conclusion.
2. LE VARIOGRAMME
Linterpolation spatiale est un problème classique destimation dune fonction F(x), où x = (x,y), en un point xp du plan à partir de valeurs connues de F en un certain nombre, m, de points environnants xi:
(1)
Le problème consiste à déterminer la pondération, i.e. les Wi, de chacun des points environnants. Il existe plusieurs façons de choisir ces poids. Les deux méthodes les plus connues sont linterpolation linéaire (en fonction de linverse de la distance) et la méthode des splines cubiques (ajustement de polynômes cubiques). Le Krigeage choisit plutôt les poids à partir du degré de similarité entre les valeurs de F, i.e. à partir de la covariance entre les points en fonction de la distance entre ces points.
Un utilisateur sérieux du Krigeage se doit de bien connaître les conditions dutilisation de la méthode. Ici, nous dirons simplement que la seule condition indispensable pour utiliser le Krigeage est que la moyenne et la variance (voir lAnnexe) de la fonction F soient stationnaires, cest-à-dire quelles ne dépendent pas de la position des points, seulement de la distance entre les points. Le variogramme est alors simplement la variance totale moins la covariance, en fonction de la distance entre les points. Le livre de Journel et Huijbregts6 présente une excellente description formelle du variogramme (et aussi du Krigeage), tout en maintenant le niveau mathéma- tique à son minimum. Le Krigeage utilisera alors le semi-variogramme (la moitié du variogramme) pour déterminer les poids dans léquation (1). Le semi- variogramme est calculé à laide de léquation (2) pour les n(h) points xi et yi séparés par une distance h = | xi - yi | :
(2)
La figure 1 présente un exemple de semi-vario- gramme g (h). Il suffit dajuster une fonction analytique à tous ces points à laide de la méthode des moindres carrés et nous obtenons alors une fonction continue caractérisant complètement la semi-variance en fonction de la distance entre les points.

Figure 1. Exemple de semi-variogramme. Les points (cercles) sont obtenus à laide de léq. (2) pour lensemble des distances h possibles, où h = |xi - yi|. Une fonction continue (la ligne continue) a ensuite été ajustée à laide de la méthode des moindres carrés.
Le choix et lajustement dune fonction au semi- variogramme est la partie la plus délicate du Krigeage : cest presquun art plutôt quune science. Le lecteur est une fois de plus renvoyé au livre de Journel et Huijbregts6 qui présente, à mon avis, la meilleure discussion des types de variogramme et de leurs comportements. Le choix du semi-variogram- me doit ensuite être validé par des tests statistiques.
3. LE KRIGEAGE ORDINAIRE
Le Krigeage consiste ensuite à calculer les Wi de léquation (1) à l'aide des valeurs de la fonction g (h) correspondant aux m points choisis. Il existe trois types de Krigeage univarié (i.e. à une seule variable) : le Krigeage simple, le Krigeage ordinaire et le Krigeage universel. La différence entre ces types d'estimation réside dans la connaissance de la statistique de la variable à interpoler :
(1) Krigeage simple : variable stationnaire de moyenne connue;
(2) Krigeage ordinaire : variable stationnaire de moyenne inconnue et
(3) Krigeage universel : variable non-stationnaire (qui contient une tendance).
Ici, nous nous restreindrons au Krigeage ordinaire, aussi appelé Krigeage ponctuel par certains auteurs, car il est le plus fréquemment utilisé. La méthode consiste à déterminer la combinaison de poids, i.e. la combinaison des Wi de léq. (1), qui garantit que les semi-variances calculées à laide du point cible xp se retrouveront sur la courbe de la figure 1. Les poids sont obtenus en multipliant les Wi, pour chacun des m points, par chacune des m semi-variances associées à ce point (les lignes de la matrice A de léq. (3)). Le problème sexprime finalement sous la forme du système de m+1 équations linéaires à m+1 inconnues suivant (Davis 1986)
(3)
où
,
et
.
Les g (hij) sont les
valeurs du semi-variogramme qui correspondent à la distance hij
entre les points xi et xj. Les g (hij)
ont déjà été calculés à partir des données à laide
de léq. (2), tandis que les g (hip) sont
calculés à laide de la fonction analytique qui a été
ajustée aux points au semi-variogramme de la fig. 1. Pour que la
solution soit non-biaisée, la somme des poids, les Wi,
doit être égale à 1. Cette dernière contrainte introduit un
degré de liberté supplémentaire dans le problème. Ce degré
supplémentaire est utilisé en ajoutant une variable libre,
(un multiplicateur de
Lagrange), dans le but de minimiser l'erreur d'estimation. Le
vecteur W est obtenu en multipliant les deux côtés de
l'équation (3) par l'inverse de la matrice A. La valeur
recherchée au point xp est ensuite calculée
en utilisant les valeurs connues de F, les F(xi),
à l'aide de l'équation (1).
La variance de l'estimation
, c'est-à-dire le
carré de l'erreur standard en chaque point, est obtenue par la
relation
. (4)
où le T indique qu'il faut utiliser la transposée du vecteur W. Si nous supposons que les erreurs d'estimation sont normalement distribuées autour de la vraie valeur, alors la probabilité que la vraie valeur soit F(xp) ± sp est de 68%, tandis que la probabilité que la vraie valeur soit F(xp) ± 2sp est de 95% (Davis 1986).
4. EXEMPLE DE KRIGEAGE ORDINAIRE
La figure 2 propose les contours de la fonction
, où
(5)
Figure
2. Contours de F(R), où
F(R) est défini par léq. (5)
Dans le but de vérifier lefficacité de la méthode, nous (Gratton et al.8) avons échantillonné cette fonction à laide de la grille irrégulière que nous avions utilisée lors dune campagne océanographi- que en mer dAlborán (en Méditerranée occidentale). Les figures 3a et 3b présentent deux estimations des contours de la fonction F(R) obtenues en calculant les pondérations à laide de la méthode de la distance inverse et par Krigeage. La grille irrégulière déchan- tillonnage est aussi reproduite sur ces figures. Autrement dit, nous tentons de reproduire, par inter- polation et extrapolation, les contours parfaitement circulaires de la figure 2, à partir des valeurs de F(R) calculées aux points identifiés sur les figures 3a,b.

Figure 3a. Estimation de la fonction F(R) à laide dune interpolation linéaire basée sur linverse de la distance. La grille irrégulière déchantillonnage est aussi présentée.
On observe que linterpolation à laide du Krigeage est de beaucoup supérieure à lautre. De plus, le Krigeage nous permet dobtenir une estimation " raisonnable " de la fonction à lextérieur (extrapolation) de la grille déchantillonnage. Il est aussi possible (et souhaitable) de tracer les contours de lerreur destimation donnée par léq. (4).

Figure 3b. Même chose que la figure 3a, mais à laide du Krigeage ordinaire.
5. DISCUSSION ET CONCLUSIONS
Nous avons présenté une introduction informelle au Krigeage et à son outil privilégié, le semi- variogramme. Nous avons eu recours à un exemple en deux dimensions mais le Krigeage sapplique tout aussi bien en trois dimensions. Lors du calcul du variogramme, nous avons utilisé le fait, sans lénoncer, que le variogramme était isotrope, cest-à-dire que la variabilité était la même dans les toutes les directions du plan. Ce nest généralement pas le cas. Lorsque cela se produit, nous devons définir un variogramme pour chacun des axes du plan. De plus, nous avons utilisé tous les points disponibles pour calculer les Wi : la plupart des logiciels de contouring nen utilise quun sous- ensemble. Davis7 présente une description des diffé- rentes méthodes de contouring. Finalement, il existe une version multivariée (i.e. à plusieurs variables distinctes) du Krigeage. Le lecteur intéressé est invité à consulter larticle de Marcotte9 et le livre de Deutsch and Journel10 qui nous proposent des logiciels écrits en MatlabÒ et en FortranÒ , respectivement. Nous (Gratton et Lafleur11) les avons réunis en une seule boîte à outils en MatlabÒ . Il existe cependant plusieurs autres logiciels gratuits aussi disponibles sur Internet. Le site suivant de lUni- versité de Lausanne, entre autres, est un excellent point de départ pour obtenir plus dinformations sur les logiciels disponibles :
Le Krigeage est la méthode optimale, au sens statistique, dinterpolation et dextrapolation. Cest la méthode destimation la plus précise. Contrairement à toutes les autres méthodes, elle nous permet aussi de calculer lerreur destimation. Il faut cependant ajouter que dans plusieurs cas, et spécialement dans le cas dune grille régulière déchantillonnage, la méthode des splines cubiques produit des résultats à peu près " équivalents " à ceux obtenus par Krigeage12, tout en étant plus rapide et plus simple à utiliser. Si la précision des résultats est importante, le Krigeage demeure, même dans ce dernier cas, la méthode de prédilection.
ANNEXE : Moments dordre un et deux
Une variable aléatoire, Z(x) où x est le vecteur (x,y), est une fonction qui prend un ensemble de valeurs ou de réalisations selon une distribution de probabilités quelconque. Ces réalisations peuvent être des tempé- ratures, des concentrations de minerai, labondance de zooplancton, etc. Une fonction aléatoire est un ensemble de variables aléatoires définies sur une région dintérêt : {Z(x), x Î une zone d'étude}. Les deux premiers moments dune fonction aléatoire sont
Moment dordre un ou lespérance mathématique.
La moyenne: m(x) = E{Z(x)}
Moments du second ordre.
a) La variance: Var{Z(x)} = E{ [Z(x) - m(x)]2 }
b) La covariance: C(x1,x2) = E{ [Z(x1)-m(x1)]
[Z(x2) - m(x2)] }
c) Le variogramme: 2g (x1,x2) = Var{ Z(x1) - Z(x2) }
Si la fonction aléatoire est stationnaire, alors
Var{Z(x)} = E{Z(x) - m2} = C(0) et
g (h) = ½ E{[Z(x+h) - Z(x)]2} = C(0) - C(h).
1) Krige, D.G. A statistical approach to some basic mine valuation problems on the Witwatersrand. 1951. J. of Chem., Metal. and Mining Soc. of South Africa, 52, 119-139.
2) Matheron, G. 1963. Principles of Geostatistics. Economic Geol., 58, 1246-1268.
3) Gandin, L.S. 1965. Objective Analysis of Meteorological fields. Israël Program for Scientific Translations, No. 1373, 242 p.
4) Bretherton, F.B., R.E. Davis and C.B. Fandry. 1976. A technique for objective analysis and design of oceanographic experiments applied to MODE-73. Deep-Sea Res., 23, 559-582.
5) Liebelt, P.B. 1967. An introduction to Optimal Estimation, Addison-Wesley, 267 p.
6) Journel, A.G. and C.J. Huijbregts. 1978. Mining Geostatistics. Academic Press, 600 p.
7) Davis, J. C. 1986. Statistics and Data Analysis in Geology. 2nd ed, John Wiley & Sons. New York, 289 p.
8) Gratton, Y., L. Prieur, R.G. Ingram, et C. Lafleur. 2002. Les courants en mer dAlborán Est pendant la campagne Almofront-I. Rapport interne, INRS-ETE.
9) Marcotte, D. 1991. Cokriging with MATLAB. Computers & Geosciences, 17(9): 1265-1280.
10) Deutsch, C.V. et A.G. Journel. 1992. GSLIB - Geostatistical Software Library. Oxford Univ. Press, New York, 340 p.
11) Gratton, Y. et C. Lafleur . 2001. Le Matlab Kriging Toolbox. Version 4.0. Manuel de référence, INRS-ETE. Le logiciel est disponible gratuitement à ladresse suivante :
http://www.inrs-ete.uquebec.ca/activites/repertoire/yves_gratton/krig.htm
12) Dubrule, O. 1984. Comparing Splines and Kriging. Computers & Geosciences, 10(2-3): 327-33.
Auteur : Yves Gratton,
INSTITUT NATIONAL DE LA RECHERCHE SCIENTIFIQUE
INRS-Eau-Terre-Environnement
B.P. 7500, Québec, Qc, Canada, G1V4C7
Yves_Gratton@inrs-ete.uquebec.ca
Date : 22/07/02