Avobis nettoie les fichiers d'adresses - de manière entièrement automatique et numérique. Dirk Kunischewski, Senior Data Analyst et co-développeur du GeoCoder, nous donne dans cette interview des informations sur le fonctionnement, les champs d'application et la valeur ajoutée que le GeoCoder apporte aux utilisateurs.
Le GeoCoder est la dernière innovation de la maison Avobis et se base sur l’une des plus grandes bases de données géographiques de Suisse, qui est créée et gérée par Avobis. Le GeoCoder compare un jeu de données d’adresses avec cette base de données géographiques, reconnaît les entrées erronées et les rend visibles. Ce service aide les entreprises à maintenir leurs données d’adresses à jour. Les entreprises qui ne veulent ou ne peuvent pas confier leurs données à l’extérieur pour les traiter ont la possibilité d’implémenter le GeoCoder directement dans leur propre infrastructure informatique.
Dirk Kunischewski est Senior Data Analyst chez Avobis et co-développeur du GeoCoder. Dans cette interview, il nous permet de jeter un coup d’œil sur l’épaule et nous montre la valeur ajoutée qu’apporte un nettoyage et un enrichissement des adresses.
Toutes les entreprises ont, ici et là, des adresses manquantes ou erronées. Qu’est-ce qui rend la procédure d’Avobis si particulière ?
Dirk Kunischewski : C’est exemplaire pour de nombreux clients. Les adresses existantes recèlent de nombreux potentiels, mais on n’est pas sûr que les données soient utilisables telles quelles. La plupart du temps, il suffit de jeter un coup d’œil dans le stock de données et, après les premiers échantillons, les enregistrements incomplets et les doublons, on se doute que la prudence est de mise. Chez Avobis, nous avons encore un autre défi à relever : en tant que prestataire de services, nous gérons des données, des données personnelles – ainsi que des données personnelles sensibles – pour nos clients/mandants et suivons des obligations réglementaires strictes. Cela implique de séparer les clients et de contrôler strictement l’accès aux données.
Télécharger des listes d’adresses chez des prestataires de services d’adresses pour les faire nettoyer ou les interroger systématiquement par API n’est pas une option à ce stade.
Quelles sont les options dont on dispose à ce stade en tant que responsable des données ?
On apporte les données de référence aux listes d’adresses. Nous utilisons pour cela notre GeoCoder on Premise, différentes collections de données de référence sont disponibles avec une logique de recherche floue intelligente dans une application facile à utiliser.
Le GeoCoder on Premise est copié dans sa propre infrastructure sécurisée. La première étape consiste à effectuer une analyse initiale des fichiers d’adresses afin de déterminer l’état actuel. L’état des données détermine ensuite la suite des opérations.
Que se passe-t-il dans l’analyse initiale ?
Le GeoCoder établit un aperçu de la vérification des adresses et les répartit en trois groupes : Les données qui sont correctes, les données qui présentent des anomalies et auxquelles le GeoCoder attribue une proposition – ici, les erreurs de frappe des noms de rue ou des codes postaux sont par exemple visibles. Le dernier groupe contient des données présentant des anomalies, pour lesquelles aucune proposition n’a pu être trouvée.
Comment peut-on imaginer cela ?
Voici quelques chiffres du dernier nettoyage de données avec Avobis GeoCoder : sur 3466 adresses, près de 186 ont présenté des anomalies, ce qui est un résultat typique. Le GeoCoder a généré de manière autonome 109 propositions pour les adresses problématiques, ce qui permet un traitement rapide lors de la correction ou du nettoyage. Pour le reste, aucune proposition n’a pu être générée et un travail manuel s’impose.
Le GeoCoder travaille avec le langage de script Python, qui permet de couvrir de nombreux cas d’application : de la correction entièrement automatique dans les bases de données des applications à la création de listes de correction.
Comment nettoyer les données ici ?
Pour notre client, il était important d’introduire manuellement les éventuelles corrections dans le système afin de garantir l’exactitude des données. Une particularité lors d’une vérification était que les objets immobiliers étaient en partie en phase de planification et qu’ils se voyaient donc attribuer des rues ou des numéros de maison qui n’étaient pas encore enregistrés dans les données de référence officielles. Nous sommes donc parés pour toutes les éventualités et tous les souhaits de nos mandants !
Haben Sie Datensilos, unvollständige Adressdaten und Dubletten unstrukturiert über verschiedene Systeme und Listen verteilt und keine Möglichkeit, die Daten extern bereinigen zu lassen?
Dann kontaktieren Sie uns für eine individuelle Offerte.
Contact
Brandschenkestrasse 38
8001 Zurich