L’open data des décisions de justice : un nouveau mode de publication des décisions

La définition de la signification et de la portée de l’open data des décisions de justice semble encore devoir être clarifiée, même si deux régimes distincts se dégagent de la loi de programmation et de réforme de la justice sur la base d’un critère de fréquence. Ajouter la finalité de la demande pour affiner cette clé de distinction permettrait d’écarter l’instrumentalisation de la publicité aux fins de constituer des fonds jurisprudentiels, action qui relève… de la notion de publication des décisions.


Dans le prolongement de la loi du 23 mars 2019 de programmation 2018-2022 et de réforme pour la justice[1]qui limite dans certaines hypothèses la mise à disposition électronique des décisions de justice avec le nom des magistrats, une étude de l’IFOP de juin 2019 révèlerait que 87 % des avocats seraient opposés à l’anonymisation des décisions de justice, notamment chez les 60 ans et plus (94%), ceux qui exercent en individuel (92%), les indépendants (92%) et les avocats travaillant dans le droit pénal (94%)[2]. Vu de l’étranger[3], même incompréhension de ces nouvelles dispositions, où les peines de 5 ans d’emprisonnement et 300 000 euros d’amende[4]encourues par toute personne opérant au « profilage » de juges[5], sont perçues comme « unique au monde » et à contrecourant d’un large mouvement de transparence de la vie publique, traduites par les politiques d’open data[6]. En France, une lettre co-signée par des associations de chercheurs a été adressée au Conseil Constitutionnel pour s’émouvoir des craintes d’entraves pour « les recherches sur le fonctionnement, les activités et les décisions des juridictions administrative et judiciaire[7]. » La décision même du Conseil constitutionnel n°2019-778 DC du 21 mars 2019[8], faisant suite à quatre saisines parlementaires pour effectuer un contrôle a priori de constitutionnalité de cette loi a pu être interprétée quelque peu hâtivement par certains commentateurs[9]comme un blanc-seing délivré aux legaltech pour aller puiser directement dans le gisement des données judiciaires des juridictions en revendiquant par exemple « la consécration par le Conseil constitutionnel du principe de la publicité de la justice ».

Un principe de publicité des décisions de justice consacré depuis longtemps, un principe de publication à qualifier

Or, commençons simplement par rappeler que la loi de programmation et de réforme de la justice n’a pas remis en cause les accès existants aux noms des professionnels dans les décisions de justice et ne fait qu’ajouter un nouveau mode de délivrance. De même, il n’y a rien de réellement nouveau en ce qui concerne le principe de publicité, celui étant consacré depuis bien longtemps dans notre droit positif, pour le trouver notamment dans l’article 6 § 1 de la Convention EDH et l’article 11-3 de la loi n° 72-626 du 5 juillet 1972 instituant un juge de l’exécution et relative à la réforme de la procédure civile. L’obligation posée par ce principe est satisfaite par l’accès « physique » de tout citoyen à la salle d’audience lors des débats et du prononcé de la décision, sauf exception justifiée compte tenu de la matière ou de circonstances particulières au procès. Relevons que l’obligation de prononcé public de la décision est aussi satisfaite par l’inscription du jugement au greffe du tribunal et sa parution dans les recueils officiels[10]. Ce principe de publicité vient répondre à des préoccupations tout à fait fondamentales, caractérisant ce que devrait être tout procès équitable dans un État de droit : la justice étant rendue au nom du peuple, il doit être permis à tout citoyen de constater par lui-même du respect des formalités substantielles caractérisant un tribunal (juridiction valablement constituée, règles procédurales respectées). L’accès d’un tiers à la décision est à concevoir dans ce cadre précis de manière ponctuelle et unitaire, comme un droit de regard sur toute procédure, le laissant notamment libre d’une intervention s’il y estime y avoir un intérêt. L’extension du mode de délivrance des décisions de justice à un format électronique ne peut donc que faciliter cette publicité.

Mais attention de ne pas l’assimiler à l’open data, qui est à entendre comme une forme élargie de publication des décisions de justice, cette dernière étant caractérisée par une possibilité d’accès systématique à tout ou partie du patrimoine jurisprudentiel, pour une finalité bien spécifique : la mise en relief du fond juridique de son contenu. Le terme d’open data des décisions de justice devrait être donc être strictement réservé pour qualifier précisément une nouvelle forme d’accès à titre non onéreux à une base de données consolidée d’un très grand ensemble des décisions de justice, accès concédé par une licence décrivant les conditions exactes de réutilisation des données. Forme élargie de publication qui devrait d’ailleurs être, par défaut et compte des enjeux spécifiques des décisions judiciaires par rapport à des documents administratifs, totalement pseudonymisée tout en autorisant, en fonction d’accords au gré à gré avec la recherche universitaire ou des opérateurs privés, l’accès à des flux intègres pour des finalités clairement déterminées.

Une distinction malheureusement encore en filigrane, favorisant la « stratégie du pirate »

Le Conseil constitutionnel, dans les paragraphes 96 et suivants de sa décision du 21 mars 2019, n’est pas allé aussi loin dans la clarification des finalités et s’est attaché à prévenir le transfert de la charge de la pseudonymisation sur l’ensemble des tribunaux en invoquant le principe de bonne administration de la justice. Il reconnaît ainsi la conformité des dispositions qui restreignent toute collecte systématique dans les juridictions sous le couvert de la publicité des décisions, en n’invalidant pas les restrictions posées par le législateur en cas de « demandes abusives, en particulier par leur nombre ou par leur caractère répétitif ou systématique[11]. »

La circulaire du 19 décembre 2018[12]et la note du ministère de la justice du 4 juin 2019 relative au traitement des demandes de copies de décisions judiciaires émanant de tiers à l’instance ne clarifient pas plus les concepts même si elles opèrent une distinction entre demande isolée et demandes de masse et conduisent, de fait, à définir deux régimes distincts sur un critère quantitatif. La décision de la cour d’appel Douai du 21 janvier 2019[13]ne procède pas à une analyse différente puisqu’elle a répondu favorablement à la demande d’unelegaltechen présence d’une « demande isolée ». Quant à la décision de la cour d’appel de Paris du 18 décembre 2018[14], qui s’était positionnée en faveur d’une mise à disposition de l’intégralité du répertoire des affaires civiles du tribunal de grande instance de Paris au format numérique, celle-ci a été rétractée par un nouvel arrêt de la même juridiction le 25 juin 2019 aux motifs que la demande formulée devait être analysée comme « une demande d’accès à des décisions de justice a titre gratuit sous forme électronique gouvernée par l’article L. 111-13 du COJ, correspondant à la mise en œuvre de l’open data[15] » et non une simple demande de tiers sollicitant l’accès à des décisions de justice.

Pour un égal accès de tous les opérateurs au patrimoine jurisprudentiel

Il semble impératif de pouvoir maintenant assurer un accès égal à tous les opérateurs dans un contexte où certains semblent parfois tout mélanger pour arriver à leurs fins, au mépris d’évidences, des textes eux-mêmes ou de ce que l’on pensait être de solides acquis. Delphine Iweins et Déborah Loye caractérisent dans « les Echos » ce comportement comme une « stratégie du pirate » qui « consiste à s’établir puis à miser sur le lobbying pour ajuster la réglementation », en s’interrogeant si c’est aujourd’hui une voie nécessaire à l’innovation plutôt que de « travailler main dans la main avec les acteurs établis, au risque de mourir d’épuisement à cause de leur inertie[16]. » Rien de nouveau quand l’on pense à certains prestataires de services qui ont employé les mêmes techniques dans d’autres secteurs (véhicules avec chauffeurs, livraison de repas, trottinettes électriques par exemple) pour conquérir des marchés en instrumentalisant un discours d’intérêt général. Mais, là encore, il convient de faire la part des choses et de ne pas ignorer que ce souffle de « disruption » est avant tout motivé par la défense d’intérêts particuliers imposant de convaincre d’une viabilité sans cesse renouvelée pour lever des fonds tous les 18 mois. 

Cette stratégie de vitesse a un prix et se confronte inévitablement aux conséquences de ses propres pratiques. Une legaltech française vient ainsi de faire l’objet d’une plainte qui a été déposée le 14 juin 2019 par le Conseil national des barreaux (CNB) et le barreau de Paris auprès du procureur de la République de Paris. Les plaignants allèguent 6 infractions : usurpation du titre d’avocat, escroquerie, vol simple et accès et maintien frauduleux dans un système informatique, usurpation d’identité, recel et traitement automatisé d’informations nominatives sans déclaration préalable à la Commission nationale de l’informatique et des libertés (CNIL)[17].


[1]Art.33 de la loi n° 2019-222 du 23 mars 2019 de programmation 2018-2022 et de réforme pour la justice : https://www.legifrance.gouv.fr/eli/loi/2019/3/23/JUST1806695L/jo/texte

[2]T. Coustet, 87% des avocats opposés à l’anonymisation des décisions de justice, Dalloz Actualités, 13 juin 2019 (étude IFOP pour la legaltech Doctrine) : https://www.dalloz-actualite.fr/flash/87-des-avocats-opposes-l-anonymisation-des-decisions-de-justice?utm_source=dlvr.it&utm_medium=twitter#.XQJq4_ZuJaR

[3]France Bans Judge Analytics, 5 Years In Prison For Rule Breakers, Artificial Lawyer, 4 juin 2019 : https://www.artificiallawyer.com/2019/06/04/france-bans-judge-analytics-5-years-in-prison-for-rule-breakers/ou encore M. Langford, M. Rask Madsen, France Criminalises Research on Judges, Verfassungsblogon matters constitutional, 22 juin 2019 : https://verfassungsblog.de/france-criminalises-research-on-judges/

[4]Alignant cette infraction sur le régime des peines prévues par les articles 226-18, 226-24 et 226-31 du code pénal, spécifiques à la collecte des données à caractère personnel par un moyen frauduleux, déloyal ou illicite

[5]Le texte de l’article « Les données d’identité des magistrats et des membres du greffe ne peuvent faire l’objet d’une réutilisation ayant pour objet ou pour effet d’évaluer, d’analyser, de comparer ou de prédire leurs pratiques professionnelles réelles ou supposées »

[6]Voir notamment les travaux de l’organisation multilatérale Open Government Partnershipà laquelle adhère la France : https://www.opengovpartnership.org/

[7]Des risques de la Loi de programmation 2018-2022 : lettre au Conseil constitutionnel, co-signée par l’association française de sociologie (AFS), l’association des historiens contemporéanistes de l’enseignement supérieur et de la recherche (AHCESR), l’association française de science politique (AFSP), Annette Wieviorka, Directrice de recherche émérite (CNRS) et Thomas Perroud, professeur de droit public à l’Université Panthéon-Assas — CERSA : https://afs-socio.fr/des-risques-de-la-loi-de-programmation-2018-2022-lettre-au-conseil-constitutionnel/

[8]Décision du Conseil constitutionnel n°2019-778 DC du 21 mars 2019 : https://www.conseil-constitutionnel.fr/decision/2019/2019778DC.htm

[9]Voir B. Cassar, Reconnaissance constitutionnelle de la transformation numérique du monde juridique : de l’open data aux LegalTech, Actualité du droit, Wolters Kluer, 27 mars 2019 ou Doctrine salue la consécration par le Conseil constitutionnel du principe de publicité de la justice, 22 mars 2019, site internet Doctrine.fr

[10]CEDH, 22 fév. 1984, n°8209/78, Sutter c. Suisseet art.451, 1016, 1440 CPC

[11]Art. L111-14 COJ

[12]Circ., 19 déc. 2018, NOR : JUSB1833465N, relative à la communication de décisions judiciaires civiles et pénales aux tiers à l’instance

[13]CA Douai, 21 janv. 2019, n°18/06657

[14]CA Paris, pôle 2, chambre 1, 18 déc. 2018, n°17/22211

[15]CA Paris, pôle 2, chambre 1, 25 juin 2019, n°19/04407

[16]D. Iweins, D. Loye, La guerre s’intensifie entre Doctrine et les avocats, Les Échos entrepreneurs, 27 juin 2019.

[17]Des avocats reprochent à l’une de ces legaltech un fichage compilant toutes les décisions de justice dans lequel leurs noms apparaît, avec le nom de leurs clients, même ceux dont la procédure est toujours en cours. Ce qui explique également la résolution du CNB du 15 juin 2019 visant à bénéficier des mêmes garanties que les magistrats et les fonctionnaires de greffe.

Pour en finir avec les fantasmes de l’open data des décisions de justice

[Mise à jour du 23 novembre 2019 : Un amendement a été adopté. Déposé par Paula Forteza (TA AN n° 1396, 2018-2019, amendement n° 1425), il porte sur la réutilisation du nom des magistrats placés en open data et sanctionne certaines finalités de poursuite pénale : « Les données d’identité des magistrats et des fonctionnaires de greffe ne peuvent faire l’objet d’une réutilisation ayant pour objet ou pour effet d’évaluer, d’analyser, de comparer ou de prédire leurs pratiques professionnelles réelles ou supposées. La violation de cette interdiction est punie des peines prévues par les articles 226‑18, 226‑24 et 226‑31 du Code pénal, sans préjudice des mesures et sanctions prévues par la loi n° 78‑17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés ». Le billet ci-dessous, du 9 novembre 2018, ne tenait pas compte de cette évolution. Il demeure encore des points à éclaircir : adresse postale, régime du nom des avocats et autres professions ayant concouru à la décision]

L’Assemblée nationale vient d’adopter ce 9 novembre 2018 un amendement extrêmement technique à l’article 19 de la loi de programmation 2019-2022 et de réforme pour la justice, portant sur l’ouverture libre au téléchargement de la base de données de toutes décisions de justice (open data). Cet amendement tranche la question de la mention des noms des magistrats et desfonctionnaires de greffe dans cette base informatique structurée, en posant un principe de publicité, sauf « à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage ».

En témoin extérieur, il n’y aurait là rien d’anormal à ce que les décisions de justice, par nature rendues au nom du peuple français et publiques, portent mention des noms des professionnels ayant concouru à la prise de décision. Ce serait même la traduction numérique d’une obligation connue de publicité des décisions de justice, déjà codifiée[1]. Pourtant, cet amendement cherche à atteindre un autre objectif, non mentionné dans l’exposé des motifs : celui de pouvoir profiler les juges.

1/ Distinguer les finalités propres de la publicité des décisions de justice de celles de l’open data

Clarifions immédiatement le débat afin de prévenir toute confusion : la publicité unitaire des décisions est déjà assurée dans les jugements papiers délivrés aux parties. Les critiques portant sur la mention de noms dans l’open data n’entendent absolument remettre en cause ces dispositions. Par ailleurs, une sélection de décisions de justice sont déjà disponibles de manière dématérialisée et pseudonymisée[2] sur Legifrance.fr (service public de la diffusion du droit par l’internet). Ce moteur de recherche permet par exemple, à l’aide de mots-clés, d’accéder à une version électronique des décisions judiciaires de la Cour de cassation et à une sélection de décisions de degré inférieur. En totale conformité avec les dispositions de la loi informatique et libertés (et au RGPD), le nom des parties est occulté et le nom des professionnels maintenu dans cette publication électronique. Là encore, les débats ne portent pas sur cette situation. Qu’est-ce qu’il y aurait donc de neuf avec l’open data ? Certainement pas une simple extension du nombre de décisions publiées sur Légifrance.

Revenons tout d’abord au changement complet de paradigme opéré par les articles 20 et 21 de la loi pour une République numérique d’octobre 2016, qui ont déjà totalement renversé la logique de publicité des décisions : d’un principe de sélection de décisions présentant un intérêt particulier résultant du décret du 7 août 2002[3], l’idée est désormais de (quasiment) tout rendre public. Mais pas d’un point de vue unitaire avec une interface de moteur de recherche comme Légifrance comme moyen d’accès, mais d’un point de vue global et systémique : au sens strict, l’open data c’est une base de données informatique brute, librement téléchargeable, et dont la licence autorise à en réemployer son contenu sans le paiement d’une redevance à son producteur. Il faut donc bien distinguer les obligations de publicité des décisions, déjà remplies par les juridictions lors de la délivrance des jugements papiers (et de manière compréhensible pour les citoyens sur Légifrance), avec les objectifs propres de l’open data des décisions de justice : rendre accessibles à tous les opérateurs (publics et privés) des données pouvant être retraitées informatiquement à volonté. Et quand on parle d’accessibilité, on ne parle pas d’intelligibilité. Ces bases de données brutes sont en effet totalement incompréhensibles pour la plupart des citoyens et ne présentent d’intérêt que pour des techniciens sachant les retraiter. On qualifie souvent les données de pétrole du XXIème siècle : l’open data est d’une certaine manière du pétrole brut gratuit à destination de raffineurs. Prêter des vertus de transparence à l’open data, c’est donc d’abord espérer que des tiers puissent s’en saisir pour créer du sens et de la valeur.

2/ Comprendre le sens et la valeur du traitement du nom des juges par des algorithmes

Et c’est bien là que se sont situés les débats postérieurs à la loi pour une République numérique, clarifiés par une mission d’étude et de préfiguration confiée au professeur Loïc Cadiet (dont les conclusions ont été rendues en novembre 2017[4]). Si cette ouverture de données ne concernait que des données non-nominatives, il n’y aurait guère de difficulté. Mais les possibilités de traitement et de croisement de noms ainsi classifiés dans une base de données rendent extrêmement sensible la question. Et le fait qu’il s’agisse de noms de professionnels, comme les magistrats, dont il convient de garantir l’indépendance et l’impartialité rend encore plus délicate cette question.

Les débats ont fait rage et tout semble s’y être mélangé. D’abord la confusion entre l’obligation de publicité et les objectifs propres de l’open data, venant de l’incompréhension totale du terme lui-même (certains ont pensé débattre des algorithmes de traitement, d’autres ont cru qu’il s’agissait de supprimer le nom des magistrats des décisions accessibles de manière unitaire sans imaginer qu’il s’agissait en réalité de la question de livrer tout le coffre au trésor, c’est-à-dire une base de données nominative). Ensuite en alimentant des soupçons corporatistes sur les magistrats qui ne résisteraient que pour éviter de rendre des comptes. Enfin, les affirmations, approximatives, de l’Assemblée nationale selon lesquelles la précédente rédaction de cet article par le Sénat aurait eu « pour effet d’empêcher l’open data des décisions de justice » en ce que « elle imposerait un objectif impossible à atteindre, sauf à effacer des parties entières des décisions de justice avant leur diffusion au public, ce qui rendrait les décisions de justice illisibles et inexploitables ». Il était question d’au moins pseudonymiser le nom des juges, non de l’anonymiser ! Tout cela a habilement occulté la question centrale qui aurait pourtant dû être traitée avant toute autre considération. Quel est le sens et la valeur du traitement d’une telle donnée nominative ?

L’exploitation des noms des présidents de formation de jugement des juridictions administratives (déjà partiellement en open data) avait pourtant permis de percevoir l’inanité d’un indicateur nominatif du taux de rejet de recours contre les obligations de quitter le territoire français[5]. Il paraissait non seulement improbable de penser isoler la tendance décisionnelle d’un président d’une formation juridictionnelle collégiale (dont la composition est par essence variable dans le temps) mais, surtout, la corrélation établie peinait à révéler une réelle cause. D’un point de vue scientifique, en effet, expliquer un comportement humain (celui d’un juge), revient à déterminer les mécanismes de causalité ayant conduit à ce comportement en présence d’un certain nombre de données contextuelles. Cela nécessite la constitution préalable d’un cadre interprétatif, constitué par les hypothèses ou points de vue adoptés par les différentes disciplines des sciences sociales[6]. Or, la seule corrélation statistique entre deux événements est insuffisante pour expliquer les facteurs réellement causatifs[7]. Appliqué au droit et aux décisions judiciaires, on mesure immédiatement ce qu’il peut y avoir de scientifiquement erroné et d’idéologique dans l’ambition de tenter de rendre objective la décision des juges grâce à des algorithmes moulinant de l’open data. Fournir une véritable explication d’un jugement nécessiterait une analyse beaucoup plus fine des données de chaque affaire et ne saurait naître spontanément d’une masse de liens lexicaux dans lesquels figure le nom d’un magistrat. Par exemple, le fait qu’un juge aux affaires familiales fixe statistiquement davantage la résidence habituelle d’un enfant chez la mère dans un ressort déterminé ne traduit pas nécessairement un parti-pris de ce magistrat en faveur des femmes, mais s’explique davantage par l’existence de facteurs sociaux-économiques et culturels propres à la population de sa juridiction[8].

3/ Et si la structuration des tuyaux de l’open data était la toute une première priorité ?

Les juges ne cherchent donc pas à être encagoulés comme l’affirmait le Canard Enchaîné le 25 avril 2018, ils n’ont pas à rougir pas de leurs décisions. Mais ils craignent des explications faussées et biaisées des décisions de justice qu’ils rendent. Car un profilage des juges qui confondrait outrancièrement corrélation et causalité viendrait profiter à des grands opérateurs économiques, à même de manipuler (dans tous les sens du terme) cette information… et probablement au détriment des citoyens que nous sommes.  

L’on perd malheureusement de vue la toute première priorité dans cette affaire : arriver à structurer les tuyaux de l’open data, puisque, à ce jour, ils n’existent que très partiellement. Il y a là un défi technique majeur à parvenir tout simplement à regrouper toutes les décisions judiciaires dans un format nativement numérique et à les pseudonymiser, défi pour lequel il conviendrait avant tout de donner des moyens substantiels au ministère de la justice, à la Cour de cassation et aux juridictions. Bien sûr, les éditeurs et des legaltechs préféreraient des flux « intègres » (c’est-à-dire des décisions dont les données nominatives ne seraient pas occultées) pour opérer eux-mêmes une pseudonymisation, mais il sera bien temps d’ouvrir progressivement les vannes de ce que l’on déverse dans la jungle numérique une fois que l’on aura clarifié, par un travail scientifique rigoureux soucieux de l’intérêt général, si l’on peut arriver à donner du sens et de la valeur à ces données sans compromettre quelques principes fondamentaux.


Les présents développements focalisent principalement sur les décisions judiciaires et le nom des magistrats – les problèmes demeurent identiques en ce qui concerne les décisions des juridictions administratives et il ne sera mentionné que l’expérience menée par le sitesupralegem.fr ; les enjeux spécifiques de la présence du nom des greffiers, des avocats ou d’autres professionnels ne seront pas développés ici mais demeurent également à questionner.

[1] L’article 454 du Code de procédure civile par exemple dispose : « Le jugement est rendu au nom du peuple français. Il contient l’indication : de la juridiction dont il émane ;  du nom des juges qui en ont délibéré ; de sa date ; du nom du représentant du ministère public s’il a assisté aux débats ; du nom du secrétaire ; des nom, prénoms ou dénomination des parties ainsi que de leur domicile ou siège social ; le cas échéant, du nom des avocats ou de toute personne ayant représenté ou assisté les parties ; en matière gracieuse, du nom des personnes auxquelles il doit être notifié. »

[2] La pseudonymisation ou « anonymisation réversible » consiste à remplacer un attribut par un autre dans un enregistrement. La personne physique n’est donc plus directement identifiable par son nom (qui est remplacé par exemple par un X…) mais elle est toujours susceptible d’être identifiée indirectement, par croisement de plusieurs données.

[3] Article R. 433-3 du code de l’organisation judiciaire

[4] L’open data des décisions de justice, mission d’études et de préfiguration sur l’ouverture au public des décisions de justice, Rapport à Madame la garde des Sceaux, ministre de la justice, novembre 2017 : http://www.justice.gouv.fr/publication/open_data_rapport.pdf

[5] M. Benesty, L’impartialité des juges mise à mal par l’intelligence artificielle in Village de la justice, Tribunes et point de vue du 24 mars 2016 ; www.village-justice.com/articles/impartialite-certains-juges-mise,21760.html – le contenu du site Supralegem.fr n’est désormais plus accessible et l’adresse redirige vers dalloz.fr

[6] Sur cette question, V. N. Regis, Juger, est-ce interpréter ? : Cahiers Philosophiques, Canopé éd., 2016, n° 147, p. 36-37.

[7] Voir le site internet Spurious Correlation qui recense un grand nombre de corrélations fallacieuses, tel qu’un taux de correspondance à plus de 99% entre 2000 et 2009 entre le nombre divorces dans l’Etat du Maine et la consommation de margarine par habitant – http://tylervigen.com/spurious-correlations

[8] Pour de plus amples développements, voir Y. Meneceur, Quel avenir pour une justice prédictive : JCP G 2018, doctr.190.

L’open data en trois définitions

Données brutes, méthodes probabilistes et politique publique : les trois visages de l’open data

Le projet de loi de programmation 2018-2022 et de réforme pour la justice, présenté le 20 avril 2018 en Conseil des ministres, propose de réécrire dans son article 19 les dispositions introduites par les articles 20 et 21 de la loi pour une République numérique promulguée… le 7 octobre 2016.

Cette intense production législative ne concerne pas les dernières réformes procédurales ou territoriales de la justice mais a pour objet l’ouverture en open data des décisions des tribunaux. L’intensité des débats dans ce domaine pourrait paraître inattendue au vu des principes démocratiques invoqués a priori : pourquoi s’opposer à l’amélioration de la transparence de la justice en garantissant la disponibilité, le partage et la réutilisation des décisions juridictionnelles ? Le principe général de transparence de l’action publique, porté notamment dans un cadre international par le Partenariat pour un Gouvernement Ouvert (PGO), se heurte toutefois à une problématique majeure : la confusion d’un grand nombre de notions en utilisant un vocabulaire à la mode. Or sans vocables communs, il semble ne pas y avoir de pensée claire possible et – naturellement – de convergence vers une stratégie d’emploi des opportunités offertes par le numérique dans l’intérêt de la justice.

1/ L’open data au sens strict : des données brutes téléchargeables, sous licence non-onéreuse

Au sens strict, l’open data c’est une base de données informatique brute, librement téléchargeable, et dont la licence autorise à en réemployer son contenu sans le paiement d’une redevance à son producteur. Même si nous ne traiterons dans ce billet que des données publiques, les données ouvertes peuvent indifféremment provenir d’une source publique ou privée. En ce qui concerne le secteur public, cette base de donnée ouverte est naturellement tout à fait distincte des autres modes de publicité déjà prévus par les textes législatifs et réglementaires. Pour les décisions des tribunaux, l’open data est une forme autonome de présentation des données avec ses objectifs propres et ne se substitue pas au formalisme procédural habituel (articles 454 et suivants du code de procédure civil par exemple).

Le centre névralgique de l’open data en France se retrouve sur l’un des sites des services du Premier ministre (http://data.gouv.fr) où des centaines de bases de données sont déjà téléchargeables. Ainsi la base d’adresses nationale, les codes postaux, le cadastre, le registre des entreprises, des décisions des  juridictions administratives sont accessibles d’un simple clic. Mais quand on parle d’accessibilité, on ne parle pas d’intelligibilité. Ces bases de données brutes sont en effet totalement incompréhensibles pour la plupart des citoyens et ne présentent d’intérêt que pour des techniciens sachant les retraiter. On qualifie souvent les données de pétrole du XXIème siècle : l’open data est d’une certaine manière du pétrole brut gratuit à destination de raffineurs.

Prêter des vertus de transparence à l’open data, c’est donc d’abord espérer que des tiers puissent s’en saisir pour raffiner les données et créer du sens. Mais avec quelles méthodes ? C’est l’objet d’une interprétation plus large du terme open data.

2/ L’open data au sens large : des nouvelles méthodes de traitement de l’information

Le terme open data peut aussi être employé de manière large pour englober les données brutes mises à disposition et leur traitement avec des méthodes extrêmement avancées : algorithmes, data science, data mining, intelligence artificielle, machine learning… la sophistication des termes entretient une totale confusion car, comme dans une œuvre de science-fiction, la technologie se mêle parfois aux fantasmes.

Pour se départir d’une approche simplement intuitive, il faut revenir aux fondements des sciences et technologies actuellement employées : ces traitements se fondent sur des approches probabilistes qui n’ont rien révolutionné dans le champ théorique mais qui profitent de capacités de stockage et de calcul considérablement améliorées ces dernières années. Ce qui semble nouveau, c’est que ces nouvelles capacités ont permis des traitements massifs de données par une approche corrélative et inductive au détriment des approches  causales et descriptives : ainsi, plutôt que de tenter de quantifier le réel et de le modéliser, l’exploitation de grands ensembles de données sont désormais censés révéler des phénomènes complexes par la présence de corrélations auparavant imperceptibles[1].

Dans le champ de l’exploitation des décisions de justice, les débats sur l’open data se sont donc aussi portés sur l’exploitation des données mises à disposition avec ces approches inductives (voire prédictives) : pourrait-on révéler de la masse des décisions un sens nouveau de l’application de la loi ? En se fondant sur le nom des juges, arriverait-on à révéler des biais et un manque d’impartialité ?

3/ L’open data en tant que politique publique

Et c’est là où l’open data n’est plus un simple instrument de transparence mais devient porteur d’une véritable politique publique aux termes de laquelle se dégagerait une « norme issue du nombre », s’imposant quasiment aux juges  comme une nouvelle source du droit. Une politique où le juge, se sachant scruté, serait plus sensible à la discipline imposée par les juridictions supérieures.

A ce stade, il ne s’agit pas de se prononcer pour ou contre de nouveaux projets de fonctionnement de la mécanique de production des décisions (ce champ d’opportunité appartient à un débat public démocratique pour savoir ce que l’on veut faire du système judiciaire), mais de constater que les objectifs recherchés se fondent sur des approches parfois discutées entre les experts (citons par exemple la distinction connue entre les méthodes bayésiennes les méthodes fréquentistes depuis le siècle des Lumières[2]).

En annonçant que les juges deviendraient « encagoulés » [3] du fait de l’anonymisation (ou la  pseudonymisation) de leurs noms dans les bases de données brutes ouvertes, il y a donc une erreur de compréhension majeure qui conduit à occulter le réel débat qui devrait impérativement s’opérer. Estime-t-on sérieusement que nous sommes aujourd’hui en mesure de créer du sens à partir de méthodes inductives sur la base de décisions juridictionnelles dont on connaît les mérites mais aussi les défauts ? Défauts parmi lesquels on pourrait citer le caractère lapidaire ou obscur de certaines motivations… Par ailleurs, traiter le nom des juges ainsi ne conduirait-il pas à imaginer dans de possibles corrélations des faits n’ayant aucun fondement sérieux : par exemple des droits de garde plus fréquemment attribués aux mères ne révèlent pas nécessairement un parti pris du magistrat.

Les annonces prophétiques, comparant par exemple la justice aux majors des industries musicales des années 2000 ou annonçant la disparition de la justice si elle ne s’hybridait pas avec les méthodes probabilistes, sont donc à prendre avec recul. Penser une politique d’open data pour la justice impose un recours à des approches pluridisciplinaires scientifiquement fondées (droit, théorie du droit, économie, sociologie, mathématiques, statistiques, informatique), nourries de débats et d’expérimentations, à même d’enrichir un débat public éclairé. En somme, être en mesure de choisir collectivement dans quel monde nous souhaitons vivre.


Aller plus loin ?

Retrouvez l’entretien avec François Paychère au sujet de l’open data sur le podcast  des temps électriques, disponible sur Amicus Radio.

 

 


Notes

[1] C. Anderson, The end of theory. The data deluge makes the scientific method obsolete, Wired, 2008.
[2] Voir par exemple C. Fauré, Deux visages du calcul des probabilités : bayésien et fréquentiste, 2013.
[3] Des juges encagoulés ?, Le Canard Enchaîné, 25 avril 2018.

Chronique de l’émission “Open data”

Open data : données ouvertes pour monde ouvert… ou totalitaire ?

Invité : François Paychère, magistrat à la Cour des comptes de Genève

Le XXIème siècle sera transparent ou ne sera pas.

Un vent nouveau semble en effet souffler ces dernières années sur les politiques publiques occidentales, avec un certain nombre de concepts, où le rapport des citoyens avec leurs gouvernants paraît devoir se transformer d’une relation verticale (contrôle / soumission) à un rapport plus horizontal, dans une totale transparence de l’action publique.

La déclaration des droits de l’homme et du citoyen de 1789 en posait évidemment les bases en imposant à tout agent public de rendre compte de son administration. Mais les politiques d’ouverture des données nous conduisent sur un bien autre chemin.

Redéfinissons rapidement quelques concepts utilisés (et parfois maltraités dans les débats) : une première confusion est fréquente entre accès à l’information et accès aux données.

En effet, un certain nombre d’informations publiques, nécessitant une large publicité, bénéficient déjà des nouvelles technologies pour assurer leur diffusion : ainsi Légifrance est le premier canal dématérialisé d’informations certifiées, où l’on trouve non seulement des textes législatifs ou règlementaires, que de la jurisprudence ou des nominations à des emplois publics. Mais cette information unitaire, même disponible sur internet, est totalement distincte de l’accès direct à des données organisées et constituées en base, pouvant être traitées par un ordinateur.

L’open data concerne donc seulement la diffusion de ces bases qui, agglomérées en tout ou partie avec d’autres sources structurées constituent le big data.

La seconde confusion consiste à confondre l’ouverture des données elles-mêmes avec leur moyens de traitement. Nombre de discours sur cette ouverture concernent en réalité les traitements opérés par diverses méthodes avancées que l’on qualifie globalement de data science.  Justice prédictive avec de l’intelligence artificielle, moteurs de recherches avancés avec divers critères, robots juristes sont autant d’applications algorithmiques qui sont nourries de données mais n’ont rien à voir avec la politique d’ouverture elle-même.

Les données c’est le pétrole et donc le carburant du XXIème siècle, les algorithmes le moteur.

L’ouverture de ces données ne s’opère donc pas de manière si anodine que cela : alors oui, quand l’Open Government Partnership (lancé en 2011 sur la base d’un accord multilatéral avec 70 pays à bord, soutenu par le Tides Center, organisation philantropique américaine) déclare solennellement que cette gouvernance 2.0 ou 3.0 (je m’y perds) va favoriser la transparence de l’action publique, prévenir la corruption, associer les citoyens aux politiques publiques, on peut y lire un nouvel achèvement pour la démocratie.

Mais concrètement qui dans la société civile aura les moyens de traiter ces données. Spécifiquement pour les décisions judiciaires, qui va bénéficier directement de l’ouverture de ce marché. Et, même si l’on ne discutera pas aujourd’hui d’une application spécifique, quelles transformations, dans la construction de la jurisprudence par exemple, anticiper ?

Enfin, comment articuler cette ouverture avec le règlement européen sur la protection des données, qui entrera en vigueur le 25 mai 2018 ? Puisque open data ne rime pas nécessairement avec données anonymes… le nom des juges administratifs français (en tout cas de certains présidents de formation de jugement) sont déjà ouverts !

Ecoutez l’entretien de François Paychère, magistrat à la Cour des comptes de Genève, sur Amicus Radio.

Chronique de l’émission “La justice prédictive”

Quel avenir pour la justice dite prédictive ?

Invité : Bruno Cathala, juge à la Cour de cassation

La justice prédictive a été un des grands sujets de buzz de l’année dernière… j’emploie le passé car une expérimentation a pris fin en octobre 2017 dans les cours d’appel de Lille et de Rennes et le constat semble sans… appel : Cela ne servirait à rien. Ou presque.

Il faut dire que les promesses de départ étaient ambitieuses : challenger, comme l’on dit aujourd’hui, l’impartialité du juge, lever le voile sur un avenir rempli d’aléa judiciaire, conseiller – dissuader même – le justiciable d’aller rencontrer un juge car, tout bien pesé, son affaire ne vaudrait pas tripette.

Cet enthousiasme excessif, hérité de la réussite des systèmes prédictifs des pays de common law, s’est heurté à une réalité tout autre sur le continent, qui ne tient pas à la légendaire résistance au changement des français, qui auraient la baguette coincée sous leur bras et leur béret vissé sur la tête.

La machine apprenante, l’intelligence artificielle, ce bazar de silicone qui sait maintenant construire de manière autonome ses propres règles de gestion n’est effet pas très souple aux changements complets de paradigmes et de concepts. Prévoir la météo à plusieurs jours de distance reste complexe par le nombre d’éléments à prendre en compte mais les règles physiques ne sont pas totalement bouleversées au hasard de la volonté des humains. Apprendre à jouer au Go est autrement plus profond que jouer aux échecs mais – là encore – des règles solides servent de fondement.

Que penser de la solidité de la loi et des règles fondatrices du droit continental ? Très simplement que si la loi change, toute la construction jurisprudentielle s’écroule. Donc d’emblée, l’affaire partait mal.

Ajoutons à cela un détail qui n’en est pas un : qu’est-ce que ces machines apprennent exactement en ingurgitant des tonnes d’affaires à l’intérêt jurisprudentiel extrêmement variable (pour ne pas être désagréable avec leurs producteurs).

Rien.

Enfin si, cela peut nourrir des calculs statistiques (nous sommes d’ailleurs plus proches de la prévision que de la prédiction)… mais croire que les intelligences artificielles apprennent ainsi la règle de droit revient à envisager que mon chat – qui est fort sympathique – sait lire l’heure car il anticipe en miaulant le moment de l’arrivée de ses croquettes.

Les concepteurs des intelligences artificielles admettent d’ailleurs volontiers cette limite : ils savent avoir perdu la compréhension de ce qui se passe dans la boîte noire des intelligences artificielles… et d’ailleurs ils ne s’en émeuvent que très modérément !

Pourquoi ?  Car seul le résultat compte ! Par petits pas, test de toutes les possibilités et des milliards de vies consommées, une machine arrive à terminer Super Mario. C’est cela qui compte pour ses concepteurs et non la manière dont elle joue.

Alors on fait quoi de tout cela ? Rien ?

Poursuivez avec l’entretien de Bruno Cathala, juge à la Cour de cassation sur Amicus Radio.