Cartographier les données partagées : un outil tactique et stratégique de
contrôle de la délinquance


Consultant, membre de International Association of Crime Analysts et International CPTED Association
Jean-Luc BESSON


Mots clés : cartographie de la délinquance ; déontologie et éthique, analyse géo-criminelle ; STIC ; statistiques ; hot spot

RESUME - La cartographie de la délinquance ne peut se développer sans des bases de données fiables. Ce faisant, la multiplicité des intervenants en sécurité et des organisations exposées aux risques criminels impose de ne pas se limiter à la seule base de données de recueil des plaintes. Celle-ci connue sous le nom de STIC ou JUDEX donne lieu à l'établissement de l'état statistique 4001, seul source publiée. Les lois sur les données individuelles, informatique et libertés, la protection des victimes, la présomption d'innocence, semblent s'opposer à toute évolution de l'analyse criminelle en sécurité publique et à tout progrès scientifique de la discipline. Ce n'est pas exact. La CNIL a autorisé la cartographie de données policières et le partage de ces informations dans un cadre prédéfini. Elle met ainsi en œuvre un contrôle a posteriori, qui est l'essence de Directive européenne sur la libre circulation des informations. Ceci ne doit pas empêcher d'examiner les conditions d'un partage raisonnable du " secret " des données publiques et privées dites " sensibles " et les limites des outils mathématiques d'analyse géo-criminelle.

 


Introduction

Cartographier des bases de données géolocalisées par l'utilisation des SIG consiste à revenir à la définition même de l'existence du système d'information géographique. Un SIG est un outil géomatique, qui gère le stockage de données localisées pour les extraire, les représenter, les analyser. Le partage de l'information est l'essence même du SIG, qui est en capacité d'intégrer plusieurs domaines de connaissance dans un seul environnement.

Outre cette intégration technique pluridisciplinaire, le partage de l'information peut s'entendre de trois manières :
1 - une information communiquée au sein de l'organisation par les professionnels entre eux ;
2 - une information disséminée dans le domaine public ;
3 - une information traitée sur un plan interprofessionnel.

Il peut aussi constituer un objectif stratégique pour l'organisation qui met le système en œuvre. Ceci induit forcément des niveaux d'accès sécurisés, un cadre réglementaire, une éthique, des bases de données normalisées pour être intelligibles. La question du secret n'est pas l'objet de ce papier. Cependant, nous sommes bien obligé de l'aborder tant les données touchant au phénomène criminel interpellent des notions fondamentales comme la protection de la vie privée ou le secret professionnel.

Le secret partagé
Le secret partagé
Le partage des données criminelles et plus largement des informations concernant des faits de cette nature, induit quasi automatiquement une entorse au principe du secret. En l'occurrence, il ne s'agit pas d'échanger des données statistiques qui ne sont finalement que des résultats plus ou moins agrégés par type et sur des échelles territoriales arbitraires plus ou moins grandes. Ce sont les données brutes localisées et indirectement nominatives qui sont en cause. Cette préoccupation est celle de praticiens de la sécurité, coordonnateurs, travailleurs sociaux, policiers, parquetiers, qui, dès qu'ils souhaitent travailler en commun, en dehors d'une procédure judiciaire, sont bloqués par divers principes et textes qui leur interdisent de communiquer. Le secret professionnel, la présomption d'innocence, les règles touchant à l'exploitation des fichiers STIC et JUDEX, les droits de la victime, dont celui de l'anonymat, sont autant d'obstacles a priori insurmontables. A tel point que l'ex Garde des Sceaux, Madame Marylise Lebranchu, avait confié à l'association " Forum Français pour la Sécurité Urbaine "(1), la rédaction d'un rapport sur le " secret partagé " et qu'un magistrat détaché à l'IHESI planchait parallèlement sur le même sujet.

Même si l'on peut penser à juste titre, que les systèmes judiciaire et administratif français sont particulièrement rétifs en matière communication de données publiques, il ne faut pas croire que ces questions ne se posent pas dans tous les pays. Un grand principe sépare les voies prises par les Etats. Aux USA et en Grande Bretagne, on considère que les données publiques sont par principe des données accessibles au public car d'intérêt public. Inversement, dans de nombreux pays européens et en Australie, les données publiques ne sont par principe pas accessibles au public, sauf volonté expresse du législateur.

En Europe, la libre circulation des informations est un droit qui entraînera des conséquences législatives et réglementaires. La Directive européenne du 24 octobre 1995 devant être transposée dans le droit français. En France, plusieurs lois touchent à l'accès aux données publiques. La loi 78-17 du 6 janvier 1978 modifiée relative à l'informatique aux fichiers et aux libertés, la loi de 1978 dite CADA, qui concerne le droit d'accès individuel à une partie des documents administratifs. La circulaire Balladur du 14 février 1994 fixe les règles de diffusion des données publiques, à l'exclusion de celles couvertes par le secret. La disponibilité est réputée gratuite dans le cas de données dites " brutes " et payante pour les données dites " élaborées ". Le principe de " disponibilité des données publiques " est subordonné au caractère diffusable, c'est à dire, à leur fiabilité et au respect des droits de la personne.

Cependant, les textes régulant l'accès aux données publiques ne concernent pas les données dites " sensibles ". Sont rangées dans cette catégorie, les données militaires, les données policières et aussi la météorologie lorsqu'elle concerne l'aéronautique ! (Cass 12.12.95). Reste à déterminer réellement ce qui relève de la matière sensible et ce qui en est exclu. La notion d'intérêt général, autre principe général du droit doit ainsi intervenir pour hiérarchiser cette " sensibilité ". On considère généralement que le fichier STIC est un danger pour la démocratie parce qu'il n'est pas contrôlé réellement et n'est pas susceptible de recours. Preuve de malaise, la CNIL a mis un certain temps à en permettre la légalisation (décret du 6 juillet 2001) et elle vient de rendre un rapport sévère sur sa maintenance. De là à le cartographier et à le diffuser sur Internet, on comprend qu'il y a une marge qui soulève des torrents d'émotions. On peut effectivement admettre aisément qu'une victime ne veuille pas rendre public, d'une manière ou d'une autre, le fait qu'elle ait été cambriolée. Cela au moins pour la raison évidente qu'elle ne veut pas laisser penser que l'habitation est vulnérable. Or, à partir d'une carte " punaise " ou " pin map ", il est éventuellement possible de déterminer l'adresse de la victime à partir du point représenté. C'est ce que la CNIL qualifie " d'information indirectement nominative ". Cependant, l'absence d'exploitation de cette information sur un mode cartographique peut priver la victime d'un outil supplémentaire de résolution de son affaire. Il reste aussi à déterminer la motivation exacte de la victime lors de son dépôt de plainte. Le fait-elle pour elle-même en ayant conscience de la garantie du secret de sa démarche ? Le fait-elle par obligation ? Le fait-elle pour aider la police sur un plan général à prendre conscience qu'il faut lutter contre ce type d'infraction ? Le débat est ouvert. Toutefois, la diversité de ces motivations n'entraîne pas forcément l'interdiction d'une exploitation cartographique et partagée de l'information transmise. Peut-être devrions-nous poser la question aux victimes ?

L'exemple britannique
La Grande Bretagne a une autre approche. En 2001, elle a organisé à Londres une conférence nationale intitulée : " Information sharing to reduce crime & disorder "(2), pour référencer cette pratique. Dans la législation britannique, le citoyen a le droit d'espérer un standard minimum de service de la part du secteur public. Et le secteur public (police) a un besoin crucial de partenariat pour prévenir et réduire la délinquance. C'est pourquoi le partage de l'information revêt une importance cruciale afin d'impliquer le public dans les programmes de réduction de la délinquance. Toutefois, ce partage doit prendre en compte le droit des victimes et des auteurs. Ce pouvoir de divulguer ces informations est mentionné à l'article 115 du " Crime and Disorder Act ". En contre partie, le " Data Protection Act ", voté la même année, introduit une législation protectrice sur les données personnelles, incluant les données vidéo mais excluant les statistiques agrégées. Ceci implique par extension la possibilité de diffuser des données individualisées à condition de masquer leur caractère nominatif. La loi britannique sur la protection des données comporte huit points centraux tout à fait ressemblant aux principes juridiques français.

Les données doivent être :
1 récoltées de manière équitable et légale
2 obtenues pour des utilisations légales et traitées en accord avec la légalité
3 pertinentes, non excessives et suffisantes
4 exactes et à jour
5 conservées le temps nécessaire mais sans excès
6 traitées en respectant les droits sur les données personnelles
7 sécurisées
8 transférées en dehors de l'Union européenne sous couvert de garanties de sécurité validées

La CNIL autorise la cartographie de Roubaix
Dans sa délibération du 28 janvier 2003 portant avis sur le projet d'arrêté du maire de Roubaix créant un traitement d'informations nominatives indirectes pour permettre la localisation et la cartographie des phénomènes de la délinquance sur la commune, la CNIL mentionne à peu près dans les mêmes termes les restrictions de communication de données issues du STIC. " Seules, les informations pertinentes et objectives doivent être utilisées pour dresser la cartographie (…) seules peuvent être enregistrées dans le traitement les informations relatives à des faits ou événements relevant de catégories précises et définies préalablement à toute collecte "(3). La durée de conservation est mentionnée. Elle n'excèdera pas la durée d'un mandat de maire. La Commission observe qu'aucune de ces informations issues du STIC ne permet d'identifier directement une victime ou un mis en cause. La Commission note aussi que le logiciel géo-statistique " GéoPrévention " respecte l'article 5 du décret du 5 juillet 2001 (4) qui désigne les catégories de personnels habilités à être destinataires des données nominatives du STIC.

Par contre, si la CNIL s'oppose clairement à une diffusion publique des cartes ainsi confectionnées, elle n'interdit pas, en revanche, que les partenaires signataires du Contrat Local de Sécurité en aient connaissance. Elle considère que "la limitation des possibilités de consultation et de diffusion des cartes constitue une garantie en matière de protection des libertés " .

Bien que n'allant pas aussi loin que notre voisin britannique, la CNIL autorise donc le partage du " secret " à un certain niveau, sous certaines conditions d'exploitation objectivée et avec des sécurités informatiques concernant l'interdiction de communication de certains champs de la base de données police. Cette jurisprudence n'a pas encore été parfaitement assimilée, ni par l'Etat, ni par ses organes centraux de la police et de la justice. Il ne fait pourtant aucun doute que cette voie sera suivie. Comme il doit être réjouissant pour les analystes, les criminologues, les chercheurs, les policiers, de savoir qu'il y a donc une vie en dehors des cartes thématiques et des statistiques à grande échelle !

Des cartes partagées dans quel but ?
L'objet de cette présentation porte sur le partage et la représentation cartographiée des données de la criminalité. Nous avons vu que les obstacles juridiques si souvent avancés pouvaient être levés. Reste à savoir qui doit être à l'origine de cette diffusion et dans quel but ?

D'évidence, la police (au sens large) est l'administration d'Etat la mieux placée pour procéder à la communication des informations. C'est elle qui collecte les informations par les plaintes et les mains courantes. C'est elle qui organise pratiquement leur classement et leur conservation. Enfin, c'est la police qui communique déjà sur les chiffres de la délinquance. On pourrait certes rétorquer que ce travail est réalisé aux dépends de la justice, qui normalement a la maîtrise de la communication par la voix du procureur. On ne doit pourtant pas oublier que la communication qui est actuellement réalisée porte sur l'activité de la police plus que sur la délinquance elle-même. C'est aussi vrai pour la justice.

Dans la pratique, la police est majoritairement le premier partenaire des villes. Les CLS ont souvent été construits sur cet axe partenarial que les derniers textes sont venus renforcer : Loi sur la Sécurité Quotidienne, Loi sur la Sécurité Intérieure, décret sur l'organisation des CLSPD (5). En outre, c'est elle, qui en conservant les données sur les plaintes et signalements, en acquiert du coup la responsabilité. Il est donc naturel, à mon sens, de considérer que la police est l'organisation qui dispose du leadership de l'information et son partage. Car c'est aussi elle, qui est la mieux placée pour informer sur le crime.

Cela suppose que cette pratique soit inscrite dans la doctrine. En excluant les Conseils de Prévention de la Délinquance, dont l'objet était de rapprocher les administrations plus que d'engager des actions opérationnelles, la première tentative réelle est à inscrire à l'actif des CLS. Puis, la réforme de police de Proximité a introduit le concept de résolution de problème, de partenariat opérationnel au travers de la mise en place de cartographies des violences. Malgré tout, le principe même de communiquer des données vers des partenaires considérés sur un pied d'équivalence, n'est pas entré dans la doctrine.

Quel intérêt y aurait-il pour la police à partager les données au travers de la cartographie ? En traitant de la diffusion des cartes sur Internet, Jerry Ratcliffe, professeur assistant à Tempe University, fournit sept bonnes raisons :
1. les cartes sur Internet peuvent produire une économie de travail pour la police
2. la diffusion de l'information au sein de la population peut entraîner une participation plus grande du public à la prévention de la délinquance
3. les cartes peuvent être un outil dans le processus de résolution de problème
4. les cartes peuvent accroître la conscience des problèmes dans le public
5. la diffusion des cartes par la police peut empêcher des erreurs d'interprétation
6. les cartes et les données accroissent l'esprit de responsabilité au sein des forces de police
Et il ajoute " qu'indépendamment du besoin généralement convenu de confidentialité, la majorité des sites montrent réellement l'endroit exact de crime illustré par le point sur la carte" (6). Par extension et en excluant pour le moment le media Internet, ces bonnes raisons sont applicables in extenso en France dans le cadre partenarial.

Data Manager Quality
La mise en pratique suppose une gestion différente des bases de données et une élévation de leur qualité. Ceci est un préalable à la mise en place d'un tel processus. Comme le souligne Sebastian Roché dans une tribune du Monde, " le plus troublant dans ces statistiques, c'est qu'elles ne sont pas utilisées pour lutter contre la criminalité. (…) Les statistiques ne sont pas utilisées localement : on met trop de temps à les produire et à les connaître. Les logiciels ne sont pas là, qui permettraient au Commissaire et au Maire de disposer d'une cartographie fine de la délinquance" (7). On pardonnera à Sebastian Roché sa méconnaissance du marché du logiciel de cartographie puisque le progiciel " GéoPrévention " produit déjà ce qu'il réclame à juste titre, c'est à dire des cartes intelligentes pour le Commissaire, le Maire, le Préfet, les sociétés HLM et les sociétés de transport en commun. Mais il n'a pas tort d'insister sur l'inadaptation des bases de données et sur la médiocrité de leur qualité.

La donnée constitue la sève de tout système d'information. Or, il faut admettre que la France ne dispose pas, en matière de criminalité, de bases irréprochables. Si l'on souhaite se rapprocher du monde réel, on comprend bien qu'il faille élargir l'observation actuellement centrée sur les plaintes, à la main courante, aux bailleurs sociaux, aux transporteurs puis à l'école et au commerce. Le STIC, fichier si décrié, est cependant indispensable à l'analyse criminelle, comme il est indispensable de le moderniser afin d'en limiter les erreurs. En outre, dans un pays fortement centralisé où l'on pourrait s'attendre à trouver une utilisation identique dans chaque commissariat, l'absence d'une stratégie centrée sur l'observation entraîne une hétérogénéité des utilisations.

Certains mettent en œuvre des modules associés. D'autres n'accordent qu'une importance moyenne à la qualité des saisies. D'autres encore développent des programmes d'analyse en propre. On assiste donc à une distorsion de l'outil. La localisation des données dans l'espace et dans le temps qui représente l'indice de qualité en analyse géo-criminelle, est plus ou moins renseignée. Ceci tient aux modalités de saisie mais aussi au sérieux que l'on accorde à cette base de donnée. Selon les sites entre 50 et 70% des faits peuvent être cartographiés automatiquement. Ce taux monte à 95% après intervention humaine.

Parmi les partenaires du monde de la sécurité, les villes et les transports publics sont les plus avancés. Toutefois, l'absence de guide général de recueil, d'élaboration, de nomenclature, de typologie, empêche actuellement ces micro-observatoires de se connecter et de dialoguer avec les bases de l'Etat. Les sociétés de transport tels que Transpole dans le Nord ou la RATP à Paris, développent des outils qui se rapprochent fortement des instruments déployés aux Etats-Unis. Outre la représentation quantifiée des phénomènes, ils introduisent la notion de temps mise en relation avec l'espace et les modes opératoires. Fortement exposés à la délinquance et aux incivilités, les bailleurs sociaux s'orientent à leur tour vers la construction de bases de données associées à la cartographie afin d'aboutir à une gestion plus efficace des moyens très onéreux utilisés pour restaurer la tranquillité.

La vue présentée ci-dessous, montre une juxtaposition d'analyses issues de bases de données hétérogènes produites sur un même territoire avec deux requêtes d'infractions. La période est identique.

 

 

 

 

 

 

 

 

 

 

 

 


Les ellipses bleues sont source police ; les ellipses marron sont sources transport ; les ellipses vertes et rouges sont source bailleurs sociaux. Requête atteintes aux biens. Les ellipses bleu ciel et mauve sont sur requête atteinte à l'environnement (8).

Si la validité de la comparaison de cette cartographie peut être contestée sur le plan scientifique à partir des arguments développés plus haut, elle n'en est pas moins révélatrice d'une situation qui ne peut être perçue que différemment par chaque organisation. L'intérêt d'une mise en commun de l'analyse saute aux yeux. Son potentiel n'apparaîtra qu'au travers d'une normalisation et, partant, d'une reconnaissance, de l'observation de chacun.

Les sources d'erreurs pouvant affecter les bases de données exploitées par un SIG sont nombreuses. Elles portent sur les volumes cartographiés, leur localisation et leur temporalité. En aucune manière, la cartographie de la délinquance peut se prévaloir de cartographier la réalité. Ce n'est d'ailleurs pas son but. Il s'agit au travers des outils d'analyse spatiale de travailler sur les faits connus et objectivement vérifiés, que ceux-ci soient des crimes, des délits ou des incivilités, mis en rapport avec leur contexte géographique. Pour parvenir à ce stade, il est souhaitable que les bases de données évitent quelques sources d'erreurs.

1. Les données géographiques doivent être complètes et à jour pour permettre la localisation des faits survenus dans de nouvelles rues.
2. les noms de rues ne doivent pas subir de variation par l'opérateur
3. Les abréviations sont à proscrire
4. Au niveau de l'agglomération, les homonymies de rues peuvent apparaître. Il est nécessaire de rattacher le réseau à un territoire
5. Le fond cartographique doit effectivement représenter le dessin des rues (raster) et ne pas simplifier le réseau par des traits abstraits. Sans quoi, les points ne seront pas correctement positionnés dans l'espace
6. En milieu rural, le système d'adressage perd son sens. Les faits sont agglomérés sur des territoires arbitraires. En procédant par balises tous les 50 mètres, on peut réduire la marge d'erreur du positionnement
7. Les SIG ne peuvent placer correctement le point sur les bâtiments possédant plusieurs entrées à la même adresse. Cela nécessite une intervention corrective. Le même problème se pose pour les parkings.
8. Une adresse vague ne peut être localisée à moins de permettre au système de travailler par approchement -tel un moteur de recherche-, mais ceci augment le risque d'erreur qui se ressentira au niveau de l'analyse géo-griminelle.

Les générations futures des SIG permettront, grâce à l'intelligence artificielle, de progresser face à ces obstacles qui constituent un réel problème pour la mise en œuvre opérationnelle des systèmes. Une étape intermédiaire pourrait être la mise en place d'un responsable des données au sein des organisations. Encore une fois, ne croyons pas être les seuls dans ces difficultés. Les anglo-saxons on créé le poste de Data Quality Manager pour y répondre.

Quel algorithme ?
Il reste à évoquer rapidement le produit analytique des bases de données. L'analyse géo-criminelle travaille avec des outils mathématiques empruntés à la physique, à la géostatistique, aux mathématiques et désormais aux recherches sur l'intelligence artificielle. Plus prosaïquement, la question qui revient est celle-ci : " est-ce que l'image projetée a un rapport avec la réalité ? " Autrement dit, en référence à la détermination des lieux de concentration dits " hot spots ", est ce que l'algorithme utilisé est le bon ? Les deux vues ci-dessous illustrent cette problématique.

L'image de gauche montre les lieux de 783 cambriolages sur un territoire de la banlieue de Sydney (Australie). Les ellipses marquent les concentrations de répétition de cambriolages. L'image de droite montre la même analyse pratiquée sur la même base de données calculées avec le logiciel STAC (ellipses A) et avec un second logiciel (spots B).fonctionnant avec un algorithme dénommé Getis Ord Gi (9).

On peut considérer ces images avec un certain effroi. On peut aussi supposer que ces trois méthodes reflètent une réalité qui est plus ou moins intéressante en fonction de notre appartenance à telle ou telle organisation. Il est clair que pour la police, dans cet exemple, STAC permet une identification plus aisée des points chauds, de leur hiérarchie et sera d'une plus grande utilité opérationnelle. Cependant, les points chauds révélés par GOG sont une réalité plus fine et plus complexe, digne d'intérêt pour un service plus stratégique. Ceci signifie que la définition des outils mathématiques employés en analyse géo-criminelle, peut modifier le résultat cartographique. Il s'agit donc de définir au préalable l'algorithme en fonction des objectifs de l'organisation. Ceci revêt une importance considérable dans le cadre d'une exploitation cartographique partagée. Entre un outil utilisé par la police, par une société de transport en commun, par un bailleur social, par un collège, il y a fort à parier que le syndrome de dispersion des nomenclatures se retrouvera dans les outils d'analyse spatiale. On ne voit pas d'ailleurs comment il en serait autrement alors que les uns visent des territoires publics, les autres des espaces privés ou des réseaux.

Ne pas réaliser ce travail - c'est exactement le même questionnement à appliquer aux analyses thématiques qui fonctionnent sur des limites territoriales arbitraires-, peut avoir des conséquences fâcheuses. Parmi celles-ci :

1. induire des décisions inappropriées
2. stigmatiser une zone
3. perdre son temps

C'est pourquoi il appartient à ceux qui croient dans les vertus de cette technologie et de cette approche analytique, de promouvoir une pratique qui respecte une éthique professionnelle, d'autant plus nécessaire qu'elle touche aux droits fondamentaux des personnes.

(1) Discours de Mme Marylise Lebranchu, ministre de la justice, lors de la Rencontre nationale sur les contrats locaux de sécurité, à Paris le 25 juin 2001
(2) Criminal Justice Conference Information sharing to reduce Crime and Disorder, September 2001, Millenium Conference Centre, London
(3) Délibération CNIL disponible auprès de l'auteur jlbesson@geoprevention.fr
(4) in J.O. numéro 155 du 6 Juillet 2001 page 10779
(5) Conseils Locaux de Prévention de la Délinquance Décret n° 2002-999 du 17 juillet 2002
(6) In Policing & Society Vo. 2 2002
(7) in Le Monde 8 avril 2002
(8) Progiciel GéoPrévention 2002
(9) in Ratcliffe & McCullagh (1999)