Règles de mise en correspondance pour le géocodage des adresses
Ce document
présente les règles usuelles de mise en correspondance utilisées par un moteur
de géocodage pour géocoder une adresse.
1) Fichier vecteur de référence des rues
Géocoder une
adresse au numéro de voie ou au centre de voie requiert avant tout un fichier
vecteur de référence des tronçons de voie. Il s'agit d'une table de données
comportant les objets vecteurs géopositionnés associés au tronçons (qui sont
représentés par des lignes brisées géopositionnées), et une structure de
données descriptive qui peut être par exemple la suivante :
Adg : numéro de voirie début gauche (*) du tronçon
Afg : numéro de voirie fin gauche (*)
du tronçon
Add : numéro de voirie début droite (*)
du tronçon
Afd : numéro de voirie fin droite (*)
du tronçon
Typevoie : Type de voie
normalisé (susceptible de prendre différentes modalités : "R",
"AV", "BD", "PAS", "IMP",...)
Nomvoie : Nom voie
normalisé
Insee gauche : code insee de
la commune située à la gauche du tronçon (**)
Insee droite : code insee de
la commune située à la droite du tronçon (**)
(*) La gauche et la droite du tronçon
sont définies par son sens de parcours ; le tronçon est en effet assimilable à
une liste ordonnées d'objets points. En parcourant le tronçon dans l'ordre de
stockage des points, on détermine un sens qui permet d'identifier la droite et
la gauche du tronçon.
(**) La plupart du temps, la commune située
à la droite du tronçon et la commune située à la gauche du tronçon ne font
qu'une. Toutefois, une voie définit parfois la frontière de deux communes. Les
numéros pairs appartiendront alors à la première commune, alors que les numéros
impairs appartiendront à la seconde commune (par exemple).
Un tel fichier de
référence, une fois indexé, est alors utilisé comme source de référence pour le
géocodage.
2) Standardisation et normalisation de l’adresse à
géocoder
Le moteur de
géocodage prend en entrée une adresse postale composée de deux champs
Adresse
(Exemple : 10 rue des Peupliers)
Code Insee de la
commune (Exemple : 92075)
Nous disposons
donc en entrée des champs Adresse et Code commune INSEE.
La première étape
du géocodage consiste à normaliser l’adresse. Ce processus de normalisation
donne naissance aux quatre champs suivants :
N0 : numéro de voie
TYPEVOIE : type de
voie normalisé
NOMVOIE : nom de la
voie (non normalisé, laissé tel qu’il a été saisi par l’utilisateur)
CODE INSEE : le code
commune INSEE initial
A titre
d’exemple, l’adresse « 10 AVENUE DU GENERAL DE GALLE » sera
normalisée par
Arcview en « 10 | AV | GENERAL GALLE »
3) Mise en correspondance
Une fois
normalisée, l’adresse recherchée, décrite par le quadruplet (NUM | TYPE | NOM |
INSEE) est confrontée aux adresses normalisées présentes dans le fichier
vecteur de référence.
La mise en
correspondance a lieu (logiquement) lorsqu’il existe un tronçon tel que
[
(NUM est contenu dans la plage Adg-Afg et INSEE=Insee gauche)
OU
(NUM est contenu dans la plage Add-Afd et INSEE=Insee droite)
]
ET
[TYPE=Typevoie]
[NOM présente un écart orthographique
et orthophonique raisonnable (***) avec Nomvoie]
(***) Cet écart est paramétrable selon que l’on recherche un géocodage souple ou strict. Il est évidemment possible d’exiger que les deux chaînes soient strictement identiques, même si cette méthode est restrictive.
Une fois la mise en correspondance effectuée, le point représentant la localisation de l’adresse est placé sur l’objet graphique vecteur tronçon par interpolation linéaire sur les numéros de voie (par exemple, 10 AV GENERAL GALLE sera placé au milieu du tronçon allant du 2 au 18 AV GENERAL GAULLE.
Ce positionnement au numéro de voie est inexact, d’abord parce que la méthode de l’interpolation linéaire est fausse (les bâtiments n’ont pas tous la même largeur), ensuite parce que le placement lui même sur le tronçon est erroné (le tronçon est l’axe médian de la voie). Toutefois, cette méthode assure un niveau d’imprécision acceptable (quelques dizaines de mètres au plus).
Toutefois la base de référence n’est jamais exhaustive (des rues ou des places peuvent manquer), ni complètement renseignée (les numéros de voie peuvent être absents).
Pour pallier le problème des numéros absents, on constitue à partir du fichier des tronçons un fichier des voies, obtenu en agrégeant les objets possédant les mêmes attributs Typevoie, Nomvoie dans une même commune. On obtient alors un fichier de référence des voies, qui permet un géocodage au centre de rue.
Le produit "Géoroute" (fichier vecteur de rues proposé par l'IGN) conduit en général au résultat suivant :
· 50 % des adresses géocodées au numéro de rue (au tronçon)
· les 50 % restant sont , au mieux, géocodés au centre de voie.
Il faut également garder à l’esprit que les adresses du type « ZONE INDUSTRIELLE DES PLATANES » ou « QUARTIER LES PEUPLIERS » ne sont en général pas présentes dans le fichier vecteur des voies.
Ces adresses peuvent toutefois figurer dans d’autres fichiers (fichiers de points d’intérêt, fichier de Zones d’Activités) qui, une fois configurés, peuvent être utilisés pour géocoder automatiquement, mais conduiront à des précisions de géocodage dégradées (quelques centaines de mètres, voire quelques kilomètres).
Auteur : Christophe Faivre-Duboz
Date :
02/04/2000