Règles de mise en correspondance pour le géocodage des adresses

 

 

 

 

Ce document présente les règles usuelles de mise en correspondance utilisées par un moteur de géocodage pour géocoder une adresse.

 

 

1) Fichier vecteur de référence des rues

 

Géocoder une adresse au numéro de voie ou au centre de voie requiert avant tout un fichier vecteur de référence des tronçons de voie. Il s'agit d'une table de données comportant les objets vecteurs géopositionnés associés au tronçons (qui sont représentés par des lignes brisées géopositionnées), et une structure de données descriptive qui peut être par exemple la suivante :

 

 

Adg : numéro de voirie début gauche (*)  du tronçon

Afg : numéro de voirie fin gauche (*) du tronçon

Add : numéro de voirie début droite (*) du tronçon

Afd : numéro de voirie fin droite (*) du tronçon

Typevoie : Type de voie normalisé (susceptible de prendre différentes modalités : "R", "AV", "BD", "PAS", "IMP",...)

Nomvoie : Nom voie normalisé

Insee gauche : code insee de la commune située à la gauche du tronçon (**)

Insee droite : code insee de la commune située à la droite du tronçon (**)

 

(*) La gauche et la droite du tronçon sont définies par son sens de parcours ; le tronçon est en effet assimilable à une liste ordonnées d'objets points. En parcourant le tronçon dans l'ordre de stockage des points, on détermine un sens qui permet d'identifier la droite et la gauche du tronçon.

 

(**) La plupart du temps, la commune située à la droite du tronçon et la commune située à la gauche du tronçon ne font qu'une. Toutefois, une voie définit parfois la frontière de deux communes. Les numéros pairs appartiendront alors à la première commune, alors que les numéros impairs appartiendront à la seconde commune (par exemple).

 

 

Un tel fichier de référence, une fois indexé, est alors utilisé comme source de référence pour le géocodage.

 

 

 

2) Standardisation et normalisation de l’adresse à géocoder

 

Le moteur de géocodage prend en entrée une adresse postale composée de deux champs

 

Adresse (Exemple : 10 rue des Peupliers)

Code Insee de la commune (Exemple : 92075)

 

Nous disposons donc en entrée des champs Adresse et Code commune INSEE.

 

La première étape du géocodage consiste à normaliser l’adresse. Ce processus de normalisation donne naissance aux quatre champs suivants :

 

N0 :  numéro de voie

TYPEVOIE : type de voie normalisé

NOMVOIE : nom de la voie (non normalisé, laissé tel qu’il a été saisi par l’utilisateur)

CODE INSEE : le code commune INSEE initial

 

A titre d’exemple, l’adresse « 10 AVENUE DU GENERAL DE GALLE » sera normalisée par

Arcview en « 10 | AV | GENERAL GALLE »

 

 

 

3) Mise en correspondance

 

Une fois normalisée, l’adresse recherchée, décrite par le quadruplet (NUM | TYPE | NOM | INSEE) est confrontée aux adresses normalisées présentes dans le fichier vecteur de référence.

 

 

La mise en correspondance a lieu (logiquement) lorsqu’il existe un tronçon tel que

 

[

(NUM est contenu dans la plage Adg-Afg et INSEE=Insee gauche)

OU

(NUM est contenu dans la plage Add-Afd et INSEE=Insee droite)

]

ET

[TYPE=Typevoie]

ET

[NOM présente un écart orthographique et orthophonique raisonnable (***) avec Nomvoie]

 

(***) Cet écart est paramétrable selon que l’on recherche un géocodage souple ou strict. Il est évidemment possible d’exiger que les deux chaînes soient strictement identiques, même si cette méthode est restrictive.

 

Une fois la mise en correspondance effectuée, le point représentant la localisation de l’adresse est placé sur l’objet graphique vecteur tronçon par interpolation linéaire sur les numéros de voie (par exemple, 10 AV GENERAL GALLE sera placé au milieu du tronçon allant du 2 au 18 AV GENERAL GAULLE.

 

Ce positionnement au numéro de voie est inexact, d’abord parce que la méthode de l’interpolation linéaire est fausse (les bâtiments n’ont pas tous la même largeur), ensuite parce que le placement lui même sur le tronçon est erroné (le tronçon est l’axe médian de la voie). Toutefois, cette méthode assure un niveau d’imprécision acceptable (quelques dizaines de mètres au plus).

 

Toutefois la base de référence n’est jamais exhaustive (des rues ou des places peuvent manquer), ni complètement renseignée (les numéros de voie peuvent être absents).

 

Pour pallier le problème des numéros absents, on constitue à partir du fichier des tronçons un fichier des voies, obtenu en agrégeant les objets possédant les mêmes attributs  Typevoie, Nomvoie dans une même commune. On obtient alors un fichier de référence des voies, qui permet un géocodage au centre de rue.

 

Le produit "Géoroute" (fichier vecteur de rues proposé par l'IGN) conduit en général au résultat suivant :

 

·         50 % des adresses géocodées au numéro de rue (au tronçon)

·         les 50 % restant sont , au mieux, géocodés au centre de voie.

 

Il faut également garder à l’esprit que les adresses du type « ZONE INDUSTRIELLE DES PLATANES » ou « QUARTIER LES PEUPLIERS » ne sont en général pas présentes dans le fichier vecteur des voies.

Ces adresses peuvent toutefois figurer dans d’autres fichiers (fichiers de points d’intérêt, fichier de Zones d’Activités) qui, une fois configurés, peuvent être utilisés pour géocoder automatiquement, mais conduiront à des précisions de géocodage dégradées (quelques centaines de mètres, voire quelques kilomètres).

 

 

 

Auteur : Christophe Faivre-Duboz

Date : 02/04/2000

 

www.iag.asso.fr