Cartographier la criminalité des villes
09/10/15

Un jeune chercheur de l’Université de Liège vient de développer un modèle numérique interactif permettant de cartographier et d’analyser les informations d’un entrepôt de données relatives à la criminalité selon une approche multidimensionnelle. Ce type de modèle est appelé SOLAP (« Spatial OnLine Analytical Processing ») : un outil classique de la géomatique, une discipline à la croisée de la géographie et de l’informatique. Mais ce type de serveur a l’habitude de générer des cartes vectorielles, qui ne peuvent présenter que des valeurs discrètes, ou discontinues. Grâce à l’utilisation d’une méthode raster, qui développe des cartes à l’aide de pixels et non plus d’entités vectorielles (points, lignes, polygones), ce nouveau modèle permet l’intégration d’un espace et de valeurs continus sur une carte dès lors plus exacte  et fidèle aux attentes de l’utilisateur. Face à l’invasion des informations numériques, de tels outils sont primordiaux pour détecter et analyser ce qui se cache dans des bases de données de plus en plus vastes. Ce modèle ne se cantonne d’ailleurs pas à la criminalité, et pourra servir des domaines tels que l’écologie, la climatologie ou encore l’épidémiologie .

A la frontière de la géographie et de l’informatique se trouve la géomatique. Une discipline récente et encore méconnue, mais aussi variée que nécessaire. On la retrouve  dans l’acquisition de données spatiales, que ce soit sur le terrain (station totale ou scanner 3D), par imagerie satellitaire ou par photographie aérienne (photogramétrie et télédétection). Des acquisitions de données qui permettent d’alimenter des bases de données spatiales (ou systèmes d’information géographique) permettant une analyse poussée du territoire.

Un autre aspect plus familier de la géomatique a investi le cœur de notre quotidien, c’est l’aspect GNSS (Global Navigation Satellite System ou système de positionnement par satellite). Le GNSS, pourvu d’une constellation de satellites, est la branche à la racine de toutes les technologies GPS qui équipent les voitures, drones, avions, téléphones, et qui permet l’amélioration continue d’outils aussi célèbres que Google maps.

Jean-Paul Kasprzyk, géomaticien ayant fraîchement défendu sa thèse de doctorat (1), assistant à l’unité de géomatique de l’Université de Liège, s’est spécialisé dans le développement d’outils liés aux bases de données. « Le monde des bases de données est divisé en deux grands embranchements, résume-t-il. Il y a d’une part les bases de données transactionnelles, destinées à monsieur tout le monde. Ce sont des outils permettant de chercher des informations assez précises, comme un itinéraire de voyage. Et d’autre part, il y a l’informatique décisionnelle. Elle tient compte d’informations multiples et de calculs statistiques plus compliqués, permettant d’agréger une multitude de données pour aider un groupe restreint de personnes à prendre des décisions. L’informatique décisionnelle développe donc des outils aidant les pouvoirs publics, les chefs d’entreprise, etc, à embrasser des réalités et des données complexes et nombreuses, et agir en fonction. »

L’objet de la thèse de Jean-Paul Kasprzyk s’inscrit dans ce second courant. « Quel que soit le profil des décideurs, qu’ils soient privés ou publics, dès qu’ils doivent tenir compte d’informations numériques, ils peuvent être confrontés à des jeux de données tellement grands qu’ils deviennent opaques à toute interprétation. Pour les analyser, il faut les résumer, et donc les agréger. » Un moyen d’agréger ces données, c’est d’utiliser un serveur OLAP (OnLine Analytical Processing), une interface numérique reliée à un entrepôt de données, et qui permet à un utilisateur de les appréhender de manière conviviale et intelligible. Un OLAP peut couvrir toutes sortes de bases données. Quand il intègre les outils informatiques liés au spatial (les SIG, ou système d’informations géographiques), il est assez simplement rebaptisé SOLAP (Spatial OnLine Analytical Processing).

Organiser de grands entrepôts de données

Repartition cambriolages LondresUn nouveau SOLAP, c’est précisément ce qu’a modélisé Jean-Paul Kasprzyk. Si le prototype semble aujourd’hui pouvoir s’acclimater à des demandes variées, il a initialement été optimisé pour une tâche très précise : la gestion d’un entrepôt multidimensionnel de données répertoriant les crimes et délits perpétrés à Londres sur l’année 2012. Le caractère multidimensionnel désigne la distinction et la comparaison possibles entre des critères d’ordres différents, comme le type de délit (cambriolage, racket, vol à l’étalage…), sa localisation (rue, quartier, district…), sa temporalité (le mois de l’année, par exemple), ou le profil des délinquants et des victimes. Quant au choix de la capitale anglaise, la raison est assez factuelle. « Je devais initialement travailler sur une base de données belge, en partenariat avec la police fédérale, se souvient le jeune chercheur. Et certains de mes interlocuteurs témoignent encore aujourd’hui d’un grand engouement pour mon travail. Mais j’ai été confronté à des problèmes structurels de confidentialité. Or, la ville de Londres fournit ce type de données en accès libre, jusqu’à un certain niveau de détail. J’ai donc pu facilement inventorier toute une série de données, et il y en avait déjà énormément, rien que pour 2012. C’était suffisant pour commencer à mettre le SOLAP au point. » Londres n’est pas la seule ville à fournir ce type de données. La police de Seattle libère aussi de nombreuses informations, que le géomaticien a également intégrées dans l’entrepôt.

(1) Integration of spatial continuity in the multidimensional structure of a data warehouse - raster SOLAP. Université de Liège, thèse de doctorat en sciences. http://hdl.handle.net/2268/182360

Page : 1 2 3 suivante