Mots clés : cartographie de la délinquance ; déontologie et éthique, analyse géo-criminelle ; STIC ; statistiques ; hot spot
RESUME - La cartographie de la délinquance ne peut se développer sans des bases de données fiables. Ce faisant, la multiplicité des intervenants en sécurité et des organisations exposées aux risques criminels impose de ne pas se limiter à la seule base de données de recueil des plaintes. Celle-ci connue sous le nom de STIC ou JUDEX donne lieu à l'établissement de l'état statistique 4001, seul source publiée. Les lois sur les données individuelles, informatique et libertés, la protection des victimes, la présomption d'innocence, semblent s'opposer à toute évolution de l'analyse criminelle en sécurité publique et à tout progrès scientifique de la discipline. Ce n'est pas exact. La CNIL a autorisé la cartographie de données policières et le partage de ces informations dans un cadre prédéfini. Elle met ainsi en œuvre un contrôle a posteriori, qui est l'essence de Directive européenne sur la libre circulation des informations. Ceci ne doit pas empêcher d'examiner les conditions d'un partage raisonnable du " secret " des données publiques et privées dites " sensibles " et les limites des outils mathématiques d'analyse géo-criminelle.
Introduction
Cartographier des bases de données géolocalisées par l'utilisation des SIG
consiste à revenir à la définition même de l'existence du système
d'information géographique. Un SIG est un outil géomatique, qui gère le
stockage de données localisées pour les extraire, les représenter, les
analyser. Le partage de l'information est l'essence même du SIG, qui est en
capacité d'intégrer plusieurs domaines de connaissance dans un seul
environnement.
Outre
cette intégration technique pluridisciplinaire, le partage de l'information
peut s'entendre de trois manières :
1 - une information communiquée au sein de l'organisation par les
professionnels entre eux ;
2 - une information disséminée dans le domaine public ;
3 - une information traitée sur un plan interprofessionnel.
Il peut
aussi constituer un objectif stratégique pour l'organisation qui met le système
en œuvre. Ceci induit forcément des niveaux d'accès sécurisés, un cadre réglementaire,
une éthique, des bases de données normalisées pour être intelligibles. La
question du secret n'est pas l'objet de ce papier. Cependant, nous sommes bien
obligé de l'aborder tant les données touchant au phénomène criminel
interpellent des notions fondamentales comme la protection de la vie privée ou
le secret professionnel.
Le
secret partagé
Le secret partagé
Le partage des données criminelles et plus largement des informations
concernant des faits de cette nature, induit quasi automatiquement une entorse
au principe du secret. En l'occurrence, il ne s'agit pas d'échanger des données
statistiques qui ne sont finalement que des résultats plus ou moins agrégés
par type et sur des échelles territoriales arbitraires plus ou moins grandes.
Ce sont les données brutes localisées et indirectement nominatives qui sont en
cause. Cette préoccupation est celle de praticiens de la sécurité,
coordonnateurs, travailleurs sociaux, policiers, parquetiers, qui, dès qu'ils
souhaitent travailler en commun, en dehors d'une procédure judiciaire, sont
bloqués par divers principes et textes qui leur interdisent de communiquer. Le
secret professionnel, la présomption d'innocence, les règles touchant à
l'exploitation des fichiers STIC et JUDEX, les droits de la victime, dont celui
de l'anonymat, sont autant d'obstacles a priori insurmontables. A tel point que
l'ex Garde des Sceaux, Madame Marylise Lebranchu, avait confié à l'association
" Forum Français pour la Sécurité Urbaine "(1), la rédaction d'un
rapport sur le " secret partagé " et qu'un magistrat détaché à l'IHESI
planchait parallèlement sur le même sujet.
Même si l'on peut penser à juste titre, que les systèmes judiciaire et administratif français sont particulièrement rétifs en matière communication de données publiques, il ne faut pas croire que ces questions ne se posent pas dans tous les pays. Un grand principe sépare les voies prises par les Etats. Aux USA et en Grande Bretagne, on considère que les données publiques sont par principe des données accessibles au public car d'intérêt public. Inversement, dans de nombreux pays européens et en Australie, les données publiques ne sont par principe pas accessibles au public, sauf volonté expresse du législateur.
En Europe,
la libre circulation des informations est un droit qui entraînera des conséquences
législatives et réglementaires. La Directive européenne du 24 octobre 1995
devant être transposée dans le droit français. En France, plusieurs lois
touchent à l'accès aux données publiques. La loi 78-17 du 6 janvier 1978
modifiée relative à l'informatique aux fichiers et aux libertés, la loi de
1978 dite CADA, qui concerne le droit d'accès individuel à une partie des
documents administratifs. La circulaire Balladur du 14 février 1994 fixe les règles
de diffusion des données publiques, à l'exclusion de celles couvertes par le
secret. La disponibilité est réputée gratuite dans le cas de données dites
" brutes " et payante pour les données dites " élaborées
". Le principe de " disponibilité des données publiques " est
subordonné au caractère diffusable, c'est à dire, à leur fiabilité et au
respect des droits de la personne.
Cependant, les textes régulant l'accès aux données publiques ne concernent pas les données dites " sensibles ". Sont rangées dans cette catégorie, les données militaires, les données policières et aussi la météorologie lorsqu'elle concerne l'aéronautique ! (Cass 12.12.95). Reste à déterminer réellement ce qui relève de la matière sensible et ce qui en est exclu. La notion d'intérêt général, autre principe général du droit doit ainsi intervenir pour hiérarchiser cette " sensibilité ". On considère généralement que le fichier STIC est un danger pour la démocratie parce qu'il n'est pas contrôlé réellement et n'est pas susceptible de recours. Preuve de malaise, la CNIL a mis un certain temps à en permettre la légalisation (décret du 6 juillet 2001) et elle vient de rendre un rapport sévère sur sa maintenance. De là à le cartographier et à le diffuser sur Internet, on comprend qu'il y a une marge qui soulève des torrents d'émotions. On peut effectivement admettre aisément qu'une victime ne veuille pas rendre public, d'une manière ou d'une autre, le fait qu'elle ait été cambriolée. Cela au moins pour la raison évidente qu'elle ne veut pas laisser penser que l'habitation est vulnérable. Or, à partir d'une carte " punaise " ou " pin map ", il est éventuellement possible de déterminer l'adresse de la victime à partir du point représenté. C'est ce que la CNIL qualifie " d'information indirectement nominative ". Cependant, l'absence d'exploitation de cette information sur un mode cartographique peut priver la victime d'un outil supplémentaire de résolution de son affaire. Il reste aussi à déterminer la motivation exacte de la victime lors de son dépôt de plainte. Le fait-elle pour elle-même en ayant conscience de la garantie du secret de sa démarche ? Le fait-elle par obligation ? Le fait-elle pour aider la police sur un plan général à prendre conscience qu'il faut lutter contre ce type d'infraction ? Le débat est ouvert. Toutefois, la diversité de ces motivations n'entraîne pas forcément l'interdiction d'une exploitation cartographique et partagée de l'information transmise. Peut-être devrions-nous poser la question aux victimes ?
L'exemple
britannique
La Grande Bretagne a une autre approche. En 2001, elle a organisé à Londres
une conférence nationale intitulée : " Information sharing to reduce
crime & disorder "(2), pour référencer cette pratique. Dans la législation
britannique, le citoyen a le droit d'espérer un standard minimum de service de
la part du secteur public. Et le secteur public (police) a un besoin crucial de
partenariat pour prévenir et réduire la délinquance. C'est pourquoi le
partage de l'information revêt une importance cruciale afin d'impliquer le
public dans les programmes de réduction de la délinquance. Toutefois, ce
partage doit prendre en compte le droit des victimes et des auteurs. Ce pouvoir
de divulguer ces informations est mentionné à l'article 115 du " Crime
and Disorder Act ". En contre partie, le " Data Protection Act ",
voté la même année, introduit une législation protectrice sur les données
personnelles, incluant les données vidéo mais excluant les statistiques agrégées.
Ceci implique par extension la possibilité de diffuser des données
individualisées à condition de masquer leur caractère nominatif. La loi
britannique sur la protection des données comporte huit points centraux tout à
fait ressemblant aux principes juridiques français.
Les données
doivent être :
1 récoltées de manière équitable et légale
2 obtenues pour des utilisations légales et traitées en accord avec la légalité
3 pertinentes, non excessives et suffisantes
4 exactes et à jour
5 conservées le temps nécessaire mais sans excès
6 traitées en respectant les droits sur les données personnelles
7 sécurisées
8 transférées en dehors de l'Union européenne sous couvert de garanties de sécurité
validées
La CNIL
autorise la cartographie de Roubaix
Dans sa délibération du 28 janvier 2003 portant avis sur le projet d'arrêté
du maire de Roubaix créant un traitement d'informations nominatives indirectes
pour permettre la localisation et la cartographie des phénomènes de la délinquance
sur la commune, la CNIL mentionne à peu près dans les mêmes termes les
restrictions de communication de données issues du STIC. " Seules, les
informations pertinentes et objectives doivent être utilisées pour dresser la
cartographie (…) seules peuvent être enregistrées dans le traitement les
informations relatives à des faits ou événements relevant de catégories précises
et définies préalablement à toute collecte "(3). La durée de
conservation est mentionnée. Elle n'excèdera pas la durée d'un mandat de
maire. La Commission observe qu'aucune de ces informations issues du STIC ne
permet d'identifier directement une victime ou un mis en cause. La Commission
note aussi que le logiciel géo-statistique " GéoPrévention "
respecte l'article 5 du décret du 5 juillet 2001 (4) qui désigne les catégories
de personnels habilités à être destinataires des données nominatives du STIC.
Par
contre, si la CNIL s'oppose clairement à une diffusion publique des cartes
ainsi confectionnées, elle n'interdit pas, en revanche, que les partenaires
signataires du Contrat Local de Sécurité en aient connaissance. Elle considère
que "la limitation des possibilités de consultation et de diffusion des
cartes constitue une garantie en matière de protection des libertés " .
Bien que n'allant pas aussi loin que notre voisin britannique, la CNIL autorise donc le partage du " secret " à un certain niveau, sous certaines conditions d'exploitation objectivée et avec des sécurités informatiques concernant l'interdiction de communication de certains champs de la base de données police. Cette jurisprudence n'a pas encore été parfaitement assimilée, ni par l'Etat, ni par ses organes centraux de la police et de la justice. Il ne fait pourtant aucun doute que cette voie sera suivie. Comme il doit être réjouissant pour les analystes, les criminologues, les chercheurs, les policiers, de savoir qu'il y a donc une vie en dehors des cartes thématiques et des statistiques à grande échelle !
Des
cartes partagées dans quel but ?
L'objet de cette présentation porte sur le partage et la représentation
cartographiée des données de la criminalité. Nous avons vu que les obstacles
juridiques si souvent avancés pouvaient être levés. Reste à savoir qui doit
être à l'origine de cette diffusion et dans quel but ?
D'évidence, la police (au sens large) est l'administration d'Etat la mieux placée pour procéder à la communication des informations. C'est elle qui collecte les informations par les plaintes et les mains courantes. C'est elle qui organise pratiquement leur classement et leur conservation. Enfin, c'est la police qui communique déjà sur les chiffres de la délinquance. On pourrait certes rétorquer que ce travail est réalisé aux dépends de la justice, qui normalement a la maîtrise de la communication par la voix du procureur. On ne doit pourtant pas oublier que la communication qui est actuellement réalisée porte sur l'activité de la police plus que sur la délinquance elle-même. C'est aussi vrai pour la justice.
Dans la
pratique, la police est majoritairement le premier partenaire des villes. Les
CLS ont souvent été construits sur cet axe partenarial que les derniers textes
sont venus renforcer : Loi sur la Sécurité Quotidienne, Loi sur la Sécurité
Intérieure, décret sur l'organisation des CLSPD (5). En outre, c'est elle, qui
en conservant les données sur les plaintes et signalements, en acquiert du coup
la responsabilité. Il est donc naturel, à mon sens, de considérer que la
police est l'organisation qui dispose du leadership de l'information et son
partage. Car c'est aussi elle, qui est la mieux placée pour informer sur le
crime.
Cela suppose que cette pratique soit inscrite dans la doctrine. En excluant les Conseils de Prévention de la Délinquance, dont l'objet était de rapprocher les administrations plus que d'engager des actions opérationnelles, la première tentative réelle est à inscrire à l'actif des CLS. Puis, la réforme de police de Proximité a introduit le concept de résolution de problème, de partenariat opérationnel au travers de la mise en place de cartographies des violences. Malgré tout, le principe même de communiquer des données vers des partenaires considérés sur un pied d'équivalence, n'est pas entré dans la doctrine.
Quel intérêt
y aurait-il pour la police à partager les données au travers de la
cartographie ? En traitant de la diffusion des cartes sur Internet, Jerry
Ratcliffe, professeur assistant à Tempe University, fournit sept bonnes raisons
:
1. les cartes sur Internet peuvent produire une économie de travail pour la
police
2. la diffusion de l'information au sein de la population peut entraîner une
participation plus grande du public à la prévention de la délinquance
3. les cartes peuvent être un outil dans le processus de résolution de problème
4. les cartes peuvent accroître la conscience des problèmes dans le public
5. la diffusion des cartes par la police peut empêcher des erreurs d'interprétation
6. les cartes et les données accroissent l'esprit de responsabilité au sein
des forces de police
Et il ajoute " qu'indépendamment du besoin généralement convenu de
confidentialité, la majorité des sites montrent réellement l'endroit exact de
crime illustré par le point sur la carte" (6). Par extension et en
excluant pour le moment le media Internet, ces bonnes raisons sont applicables
in extenso en France dans le cadre partenarial.
Data
Manager Quality
La mise en pratique suppose une gestion différente des bases de données et une
élévation de leur qualité. Ceci est un préalable à la mise en place d'un
tel processus. Comme le souligne Sebastian Roché dans une tribune du Monde,
" le plus troublant dans ces statistiques, c'est qu'elles ne sont pas
utilisées pour lutter contre la criminalité. (…) Les statistiques ne sont
pas utilisées localement : on met trop de temps à les produire et à les connaître.
Les logiciels ne sont pas là, qui permettraient au Commissaire et au Maire de
disposer d'une cartographie fine de la délinquance" (7). On pardonnera à
Sebastian Roché sa méconnaissance du marché du logiciel de cartographie
puisque le progiciel " GéoPrévention " produit déjà ce qu'il réclame
à juste titre, c'est à dire des cartes intelligentes pour le Commissaire, le
Maire, le Préfet, les sociétés HLM et les sociétés de transport en commun.
Mais il n'a pas tort d'insister sur l'inadaptation des bases de données et sur
la médiocrité de leur qualité.
La donnée
constitue la sève de tout système d'information. Or, il faut admettre que la
France ne dispose pas, en matière de criminalité, de bases irréprochables. Si
l'on souhaite se rapprocher du monde réel, on comprend bien qu'il faille élargir
l'observation actuellement centrée sur les plaintes, à la main courante, aux
bailleurs sociaux, aux transporteurs puis à l'école et au commerce. Le STIC,
fichier si décrié, est cependant indispensable à l'analyse criminelle, comme
il est indispensable de le moderniser afin d'en limiter les erreurs. En outre,
dans un pays fortement centralisé où l'on pourrait s'attendre à trouver une
utilisation identique dans chaque commissariat, l'absence d'une stratégie centrée
sur l'observation entraîne une hétérogénéité des utilisations.
Certains mettent en œuvre des modules associés. D'autres n'accordent qu'une importance moyenne à la qualité des saisies. D'autres encore développent des programmes d'analyse en propre. On assiste donc à une distorsion de l'outil. La localisation des données dans l'espace et dans le temps qui représente l'indice de qualité en analyse géo-criminelle, est plus ou moins renseignée. Ceci tient aux modalités de saisie mais aussi au sérieux que l'on accorde à cette base de donnée. Selon les sites entre 50 et 70% des faits peuvent être cartographiés automatiquement. Ce taux monte à 95% après intervention humaine.
Parmi les partenaires du monde de la sécurité, les villes et les transports publics sont les plus avancés. Toutefois, l'absence de guide général de recueil, d'élaboration, de nomenclature, de typologie, empêche actuellement ces micro-observatoires de se connecter et de dialoguer avec les bases de l'Etat. Les sociétés de transport tels que Transpole dans le Nord ou la RATP à Paris, développent des outils qui se rapprochent fortement des instruments déployés aux Etats-Unis. Outre la représentation quantifiée des phénomènes, ils introduisent la notion de temps mise en relation avec l'espace et les modes opératoires. Fortement exposés à la délinquance et aux incivilités, les bailleurs sociaux s'orientent à leur tour vers la construction de bases de données associées à la cartographie afin d'aboutir à une gestion plus efficace des moyens très onéreux utilisés pour restaurer la tranquillité.
La vue présentée
ci-dessous, montre une juxtaposition d'analyses issues de bases de données hétérogènes
produites sur un même territoire avec deux requêtes d'infractions. La période
est identique.

Les ellipses bleues sont source police ; les ellipses marron sont sources
transport ; les ellipses vertes et rouges sont source bailleurs sociaux. Requête
atteintes aux biens. Les ellipses bleu ciel et mauve sont sur requête atteinte
à l'environnement (8).
Si la validité de la comparaison de cette cartographie peut être contestée sur le plan scientifique à partir des arguments développés plus haut, elle n'en est pas moins révélatrice d'une situation qui ne peut être perçue que différemment par chaque organisation. L'intérêt d'une mise en commun de l'analyse saute aux yeux. Son potentiel n'apparaîtra qu'au travers d'une normalisation et, partant, d'une reconnaissance, de l'observation de chacun.
Les sources d'erreurs pouvant affecter les bases de données exploitées par un SIG sont nombreuses. Elles portent sur les volumes cartographiés, leur localisation et leur temporalité. En aucune manière, la cartographie de la délinquance peut se prévaloir de cartographier la réalité. Ce n'est d'ailleurs pas son but. Il s'agit au travers des outils d'analyse spatiale de travailler sur les faits connus et objectivement vérifiés, que ceux-ci soient des crimes, des délits ou des incivilités, mis en rapport avec leur contexte géographique. Pour parvenir à ce stade, il est souhaitable que les bases de données évitent quelques sources d'erreurs.
1. Les
données géographiques doivent être complètes et à jour pour permettre la
localisation des faits survenus dans de nouvelles rues.
2. les noms de rues ne doivent pas subir de variation par l'opérateur
3. Les abréviations sont à proscrire
4. Au niveau de l'agglomération, les homonymies de rues peuvent apparaître. Il
est nécessaire de rattacher le réseau à un territoire
5. Le fond cartographique doit effectivement représenter le dessin des rues (raster)
et ne pas simplifier le réseau par des traits abstraits. Sans quoi, les points
ne seront pas correctement positionnés dans l'espace
6. En milieu rural, le système d'adressage perd son sens. Les faits sont agglomérés
sur des territoires arbitraires. En procédant par balises tous les 50 mètres,
on peut réduire la marge d'erreur du positionnement
7. Les SIG ne peuvent placer correctement le point sur les bâtiments possédant
plusieurs entrées à la même adresse. Cela nécessite une intervention
corrective. Le même problème se pose pour les parkings.
8. Une adresse vague ne peut être localisée à moins de permettre au système
de travailler par approchement -tel un moteur de recherche-, mais ceci augment
le risque d'erreur qui se ressentira au niveau de l'analyse géo-griminelle.
Les générations futures des SIG permettront, grâce à l'intelligence artificielle, de progresser face à ces obstacles qui constituent un réel problème pour la mise en œuvre opérationnelle des systèmes. Une étape intermédiaire pourrait être la mise en place d'un responsable des données au sein des organisations. Encore une fois, ne croyons pas être les seuls dans ces difficultés. Les anglo-saxons on créé le poste de Data Quality Manager pour y répondre.
Quel
algorithme ?
Il reste à évoquer rapidement le produit analytique des bases de données.
L'analyse géo-criminelle travaille avec des outils mathématiques empruntés à
la physique, à la géostatistique, aux mathématiques et désormais aux
recherches sur l'intelligence artificielle. Plus prosaïquement, la question qui
revient est celle-ci : " est-ce que l'image projetée a un rapport avec la
réalité ? " Autrement dit, en référence à la détermination des lieux
de concentration dits " hot spots ", est ce que l'algorithme utilisé
est le bon ? Les deux vues ci-dessous illustrent cette problématique.

L'image de gauche montre les lieux de 783 cambriolages sur un territoire de la banlieue de Sydney (Australie). Les ellipses marquent les concentrations de répétition de cambriolages. L'image de droite montre la même analyse pratiquée sur la même base de données calculées avec le logiciel STAC (ellipses A) et avec un second logiciel (spots B).fonctionnant avec un algorithme dénommé Getis Ord Gi (9).
On peut
considérer ces images avec un certain effroi. On peut aussi supposer que ces
trois méthodes reflètent une réalité qui est plus ou moins intéressante en
fonction de notre appartenance à telle ou telle organisation. Il est clair que
pour la police, dans cet exemple, STAC permet une identification plus aisée des
points chauds, de leur hiérarchie et sera d'une plus grande utilité opérationnelle.
Cependant, les points chauds révélés par GOG sont une réalité plus fine et
plus complexe, digne d'intérêt pour un service plus stratégique. Ceci
signifie que la définition des outils mathématiques employés en analyse géo-criminelle,
peut modifier le résultat cartographique. Il s'agit donc de définir au préalable
l'algorithme en fonction des objectifs de l'organisation. Ceci revêt une
importance considérable dans le cadre d'une exploitation cartographique partagée.
Entre un outil utilisé par la police, par une société de transport en commun,
par un bailleur social, par un collège, il y a fort à parier que le syndrome
de dispersion des nomenclatures se retrouvera dans les outils d'analyse
spatiale. On ne voit pas d'ailleurs comment il en serait autrement alors que les
uns visent des territoires publics, les autres des espaces privés ou des réseaux.
Ne pas réaliser ce travail - c'est exactement le même questionnement à appliquer aux analyses thématiques qui fonctionnent sur des limites territoriales arbitraires-, peut avoir des conséquences fâcheuses. Parmi celles-ci :
1. induire
des décisions inappropriées
2. stigmatiser une zone
3. perdre son temps
C'est pourquoi il appartient à ceux qui croient dans les vertus de cette technologie et de cette approche analytique, de promouvoir une pratique qui respecte une éthique professionnelle, d'autant plus nécessaire qu'elle touche aux droits fondamentaux des personnes.
(1)
Discours de Mme Marylise Lebranchu, ministre de la justice, lors de la Rencontre
nationale sur les contrats locaux de sécurité, à Paris le 25 juin 2001
(2) Criminal Justice Conference Information sharing to reduce Crime and Disorder,
September 2001, Millenium Conference Centre, London
(3) Délibération CNIL disponible auprès de l'auteur jlbesson@geoprevention.fr
(4) in J.O. numéro 155 du 6 Juillet 2001 page 10779
(5) Conseils Locaux de Prévention de la Délinquance Décret n° 2002-999 du 17
juillet 2002
(6) In Policing & Society Vo. 2 2002
(7) in Le Monde 8 avril 2002
(8) Progiciel GéoPrévention 2002
(9) in Ratcliffe & McCullagh (1999)