Skip to contents

Géocodage au secteur statistique

phacochr a d’abord été pensé pour fonctionner en local : il devait donc être léger, rapide et portable. Cette spécificité permet notamment de géocoder des données sensibles qui ne peuvent pas être envoyées sur un serveur via une API de géocodage. Des options supplémentaires ont de ce fait été intégrées afin d’anonymiser les données qui lui sont passées. Nous en montrons un exemple sur cette page.

Partons des données d’exemples snacks contenues dans phacochr, et imaginons que nous voulons produire une information spatiale un tant soi peu précise à partir de ces données, mais en ne donnant pas d’indication de l’adresse. La fonction phaco_geocode() doit alors prendre l’argument anonymous = TRUE (par défaut réglé sur FALSE):

library(phacochr)

result_anonym <- phaco_geocode(data_to_geocode = snacks,
                               colonne_num = "num",
                               colonne_rue = "rue",
                               colonne_code_postal = "code_postal",
                               anonymous = TRUE)

Cette option a la particularité de produire des coordonnées X-Y qui ne sont pas celles de l’adresse, mais du centroïde du secteur statistique où se trouve celle-ci (les données des entités administratives - secteurs statistiques, communes… - sont quant à elles ajoutées sans changement). Toutes les informations relatives à l’adresse précise ne sont pas renseignées dans le résultat : la rue détectée, son identifiant, les corrections orthographiques éventuellement apportées, le numéro de la rue BeST avec lequel la jointure est réalisée, la langue d’écriture de la rue… Les colonnes fournies en entrée sont également supprimées : dans cet exemple, les colonnes de la base de données originale contenant la rue et le numéro (rue et num) ne sont pas reprises dans les résultats. Cette suppression permet de produire rapidement un résultat géolocalisé au niveau du secteur statistique, tout en étant anonymisé. Autrement dit, cette option permet que la géolocalisation et l’adresse ne cohabitent jamais dans le même fichier.

c("num", "rue") %in% names(result_anonym$data_geocoded)
#> [1] FALSE FALSE

Cartographie anonymisée

Lorsque cette option est enclenchée, une nouvelle colonne phaco_anonymous est ajoutée au résultat. La présence de cette colonne indique à la fonction phaco_map_s() que celle-ci doit changer sa manière de cartographier les résultats. Dans la mesure où les adresses sont localisées au centroïde du secteur statistique, les points se superposeraient dans la cartographie classiquement prévue par phaco_map_s(). Dans le cas d’une anonymisation, ce sont alors des cercles de taille proportionnelle au nombre d’adresses localisées dans le secteur statistique qui sont affichées. L’anonymisation n’empêche donc pas une cartographie exploratoire rapide des résultats :

phaco_map_s(result_anonym$data_geocoded_sf,
            title_carto = "Snacks à Bruxelles (anonymisés)")