Qu’est ce que le géocodage ?

 

 

Le principe du géocodage :

 

Le géocodage consiste à associer à un point de l’espace ses coordonnées dans un système défini. Pour un système d’information géographique travaillant en deux dimensions, il s’agit donc de définir la position d’un point par un couple de coordonnées (X, Y). Le point ainsi repéré peut alors être intégré dans le SIG pour y faire l’objet de traitements mettant en jeu sa position géographique.

 

Concrètement, l’opération de géocodage consiste généralement à associer à une adresse postale un couple de coordonnées (X, Y).

 

Ainsi le 10, rue Le Brun à Paris (siège de l’Institut d’Analyse Géographique) est associé au couple de coordonnées :

 

X = 601362

Y = 2426512

 

(dans le système de coordonnées Lambert 2 étendu).

 

Types de géocodage et données de références :

 

Pour automatiser cette opération, les SIG sont dotés de géocodeurs qui permettent de déterminer les coordonnées d’une adresse en utilisant des données géographiques de référence dont les coordonnées sont connues. En fonction de la précision du géocodage souhaité les données de références peuvent être des coordonnées de communes, de rues, ou de points remarquables.

 

Géocodage à la commune :

 

Dans le cas d’un géocodage à la commune le point géocodé est associé aux coordonnées du centroïde de la commune auquel il appartient. Avec une telle méthode, toutes les adresses d’une même commune sont géocodées en un même point. Pour une commune de surface importante, l’erreur de positionnement peut atteindre plusieurs kilomètres.

Ce type de géocodage peut être utilisé pour des études à l’échelle nationale, régionale ou départementale. Il a l’avantage d’être relativement simple et rapide à mettre en œuvre.

 

Géocodage au numéro de rue par interpolation linéaire :

 

Le géocodage à la rue ou au numéro de rue est nécessaire pour les études à l’échelle d’une ville. Ce type de géocodage met en œuvre un fichier de référence comportant la description de la géographie des tronçons de rues, le type de voie, leurs noms, leur commune de rattachement coté droite et gauche et les numéros de leurs extrémités : début droit, début gauche, fin droit, fin gauche. Les coordonnées du point à géocoder sont alors calculées par interpolation linéaire.

 

Exemple : Géocodage de l’adresse 10 rue Le Brun, Paris

 

Le moteur de géocodage cherche dans le fichier de référence le tronçon de voie associé à une plage de numéros comportant le 10, dont le type est égal à 'rue', dont le nom est égal à 'Le Brun', et correspondant à la commune recherchée.

 

 

Le point est positionné sur le tracé de la rue par interpolation linéaire du numéro de rue à positionner entre les valeurs de numéro début et fin du tronçon.

 

Ce positionnement au numéro de rue est inexact, d’abord parce que la méthode de l’interpolation linéaire est fausse (les bâtiments n’ont pas tous la même largeur), ensuite parce que le placement lui même sur le tronçon est erroné (le tronçon est l’axe médian de la voie). Toutefois, cette méthode assure un niveau d’imprécision acceptable (quelques dizaines de mètres au plus).

 

En cas d’absence de renseignement du numéro de rue de l’adresse à géocoder ou dans le fichier de référence, le géocodage peut être effectué au centroïde rue. Il convient d’avoir au préalable fusionné l’ensemble des tronçons de la rue.

 

Géocodage au point d’intérêt

 

Certaines adresses ne sont pas composées d’un nom de voie et d’un numéro, mais définie par un point d’intérêt comme par exemple : ‘zone d’activité du Moulin’. Dans ce cas le fait de disposer d’un fichier de référence de points d’intérêt permet de géocoder l’adresse au point concerné.

 

Géocodage cadastral

 

Le cadastre est un référentiel de grande précision. Il peut comporter les parcelles ou le bâti sous forme de polygones, ainsi que les adresses sous forme de points.

Il est malheureusement encore aujourd’hui très peu normalisé sous des formes exploitables par des systèmes d’information géographique. Sa forme et son coût sont donc très variables selon les communes. Pour certaines applications il est cependant le seul référentiel suffisamment fiable et précis.

 

Echec, erreurs et imprécisions de géocodage :

 

Il convient de distinguer ces trois notions liées entre elles.

 

Imprécision :

 

L’imprécision de géocodage correspond à la distance entre la position de l’adresse dans la réalité et sa position calculée par le procédé de géocodage, liée intrinsèquement à la méthode de géocodage adoptée. Dans son fonctionnement normal, on a vu que le géocodage à la commune induit une imprécision de l’ordre du kilomètre. Pour le géocodage au numéro de rue l’erreur normale est de l’ordre de la dizaine de mètres.

 

Erreur :

 

L’erreur de géocodage correspond a une imprécision anormale, c’est à dire a une imprécision qui dépasse celle liée à la méthode de géocodage. L’erreur de géocodage est liée à une mauvaise mise en relation des informations caractérisant  l’adresse à géocoder et les fichiers de référence. Cette erreur peut avoir pour source un défaut du libellé de l’adresse, un défaut d’information du fichier de référence ou une ambiguïté liée à l’adresse elle même conduisant le moteur de géocodage à faire un rapprochement erroné.

 

Un géocodeur peut cependant être paramétré pour reconnaître certains écarts orthographiques dans les adresses comportant des erreurs de saisie, et par exemple rapprocher les adresses :

AVENUE GEORGE V et AVENUE GEORGES V

 

Mais un doute peut porter sur des mots entiers et non sur une ou deux lettres. Bien que relativement normalisés, les libellés d’adresses exprimés en langage naturel comportent des pièges pour les moteurs de géocodage. Par exemple :

 

CHARLES DE GAULLE et GENERAL DE GAULLE

 

Pour éviter ce problème on peut avoir recours à des règles de normalisation d’adresses occultant toutes les chaînes considérées comme n’apportant pas d’information comme les articles, les prénoms, les fonctions ou les grades militaires. Ainsi dans l’exemple ‘DE GAULLE’ le géocodeur occulte les chaînes ‘CHARLES’ et GENERAL’ pour faire un rapprochement entre le libellé de l’adresse à géocoder et le fichier de référence uniquement sur le terme ‘DE GAULLE’.

 

Le defaut de cette méthode est de confondre les adresses pour lesquelles un prénom est la seule information discriminante entre deux libellés de voies. Par exemple :

 

RUE DU MOULIN (PAU) et RUE JEAN MOULIN (PAU)

 

Cette configuration ou l’on trouve dans une même commune deux voies de même type, l’une dénommée « JEAN MOULIN » et l’autre « DU MOULIN » est fréquente.

 

 

Echec :

 

L’échec de géocodage correspond à l’impossibilité de faire correspondre à une adresse un couple de coordonnées (X, Y) avec une précision convenable et un risque d’erreur faible.

 

A qualité d’informations égale, le taux d’échec sera d’autant plus important que la précision demandée sera importante (toutes les adresses géocodées au numéro de rue) avec un risque d’erreur minimal (type voie, nom voie strictement identiques dans l’adresse à géocoder et le fichier de référence).

 

En fonction de la problématique, des risques associés à l’imprécision ou à l’erreur de géocodage, et du temps disponible pour traiter manuellement les adresses non géocodées, on pourra choisir de privilégier l’exhaustivité , la précision ou la qualité du géocodage.

 

 

http://www.iag.asso.fr/