{"id":171,"date":"2018-04-27T23:58:58","date_gmt":"2018-04-27T21:58:58","guid":{"rendered":"http:\/\/lestempselectriques.net\/?p=171"},"modified":"2020-04-09T16:57:19","modified_gmt":"2020-04-09T14:57:19","slug":"lopen-data-en-trois-definitions","status":"publish","type":"post","link":"https:\/\/lestempselectriques.net\/index.php\/2018\/04\/27\/lopen-data-en-trois-definitions\/","title":{"rendered":"L&rsquo;open data en trois d\u00e9finitions"},"content":{"rendered":"<p><strong>Donn\u00e9es brutes, m\u00e9thodes probabilistes et politique publique : les trois visages de l&rsquo;<em>open data<\/em><\/strong><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-thumbnail wp-image-194 alignleft\" src=\"http:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/04\/Open_Data_stickers-150x150.jpg\" alt=\"\" width=\"150\" height=\"150\" srcset=\"https:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/04\/Open_Data_stickers-150x150.jpg 150w, https:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/04\/Open_Data_stickers-100x100.jpg 100w\" sizes=\"auto, (max-width: 150px) 100vw, 150px\" \/>Le projet de loi de programmation 2018-2022 et de r\u00e9forme pour la justice, pr\u00e9sent\u00e9 le 20 avril 2018 en Conseil des ministres, propose de r\u00e9\u00e9crire dans son article 19 les dispositions introduites par les articles 20 et 21 de la loi pour une R\u00e9publique num\u00e9rique promulgu\u00e9e&#8230; le 7 octobre 2016.<\/p>\n<p>Cette intense production l\u00e9gislative ne concerne pas les derni\u00e8res r\u00e9formes proc\u00e9durales ou territoriales de la justice mais a pour objet l\u2019ouverture en <em>open data<\/em> des d\u00e9cisions des tribunaux. L&rsquo;intensit\u00e9 des d\u00e9bats dans ce domaine pourrait para\u00eetre inattendue au vu des principes d\u00e9mocratiques invoqu\u00e9s <em>a priori<\/em>\u00a0: pourquoi s&rsquo;opposer \u00e0 l&rsquo;am\u00e9lioration de la transparence de la justice en garantissant la disponibilit\u00e9, le partage et la r\u00e9utilisation des d\u00e9cisions juridictionnelles ? Le principe g\u00e9n\u00e9ral de transparence de l\u2019action publique, port\u00e9 notamment dans un cadre international par le <a href=\"https:\/\/www.opengovpartnership.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">Partenariat pour un Gouvernement Ouvert (PGO)<\/a>, se heurte toutefois \u00e0 une probl\u00e9matique majeure\u00a0: la confusion d\u2019un grand nombre de notions en utilisant un vocabulaire \u00e0 la mode. Or sans vocables communs, il semble ne pas y avoir de pens\u00e9e claire possible et \u2013 naturellement \u2013 de convergence vers une strat\u00e9gie d\u2019emploi des opportunit\u00e9s offertes par le num\u00e9rique dans l&rsquo;int\u00e9r\u00eat de la justice.<!--more--><\/p>\n<h1>1\/ L\u2019<em>open data<\/em> au sens strict\u00a0: des donn\u00e9es brutes t\u00e9l\u00e9chargeables, sous licence non-on\u00e9reuse<\/h1>\n<p>Au sens strict, l\u2019<em>open data<\/em> c\u2019est une base de donn\u00e9es informatique brute, librement t\u00e9l\u00e9chargeable, et dont la licence autorise \u00e0 en r\u00e9employer\u00a0son contenu sans le paiement d\u2019une redevance \u00e0 son producteur. M\u00eame si nous ne traiterons dans ce billet que des donn\u00e9es publiques, les donn\u00e9es ouvertes peuvent indiff\u00e9remment provenir d&rsquo;une source publique ou priv\u00e9e. En ce qui concerne le secteur public, cette base de donn\u00e9e ouverte est naturellement tout \u00e0 fait distincte des autres modes de publicit\u00e9 d\u00e9j\u00e0 pr\u00e9vus par les textes l\u00e9gislatifs et r\u00e9glementaires. Pour les d\u00e9cisions des tribunaux, l&rsquo;<em>open data<\/em> est une forme autonome de pr\u00e9sentation des donn\u00e9es avec ses objectifs propres et ne se substitue pas au formalisme proc\u00e9dural habituel (<a href=\"https:\/\/www.legifrance.gouv.fr\/affichCode.do;jsessionid=8A81B0716E9C3624DD0F531085F87E5B.tplgfr29s_1?idSectionTA=LEGISCTA000006165201&amp;cidTexte=LEGITEXT000006070716&amp;dateTexte=20180427\" target=\"_blank\" rel=\"noopener noreferrer\">articles 454 et suivants du code de proc\u00e9dure civil<\/a> par exemple).<\/p>\n<p>Le centre n\u00e9vralgique de l\u2019<em>open data<\/em> en France se retrouve sur l&rsquo;un des sites des services du Premier ministre (<a href=\"http:\/\/data.gouv.fr\">http:\/\/data.gouv.fr<\/a>) o\u00f9 des centaines de bases de donn\u00e9es sont d\u00e9j\u00e0 t\u00e9l\u00e9chargeables. Ainsi la base d\u2019adresses nationale, les codes postaux, le cadastre, le registre des entreprises, des d\u00e9cisions des\u00a0 juridictions administratives sont accessibles d\u2019un simple clic. Mais quand on parle d\u2019accessibilit\u00e9, on ne parle pas d\u2019intelligibilit\u00e9. Ces bases de donn\u00e9es brutes sont en effet totalement incompr\u00e9hensibles pour la plupart des citoyens et ne pr\u00e9sentent d&rsquo;int\u00e9r\u00eat que pour des techniciens sachant les retraiter. On qualifie souvent les donn\u00e9es de p\u00e9trole du XXI\u00e8me si\u00e8cle\u00a0: l\u2019<em>open data<\/em> est d\u2019une certaine mani\u00e8re du p\u00e9trole brut gratuit \u00e0 destination de raffineurs.<\/p>\n<p>Pr\u00eater des vertus de transparence \u00e0 l\u2019<em>open data<\/em>, c\u2019est donc d\u2019abord esp\u00e9rer que des tiers puissent s\u2019en saisir pour raffiner les donn\u00e9es et cr\u00e9er du sens. Mais avec quelles m\u00e9thodes\u00a0? C\u2019est l\u2019objet d\u2019une interpr\u00e9tation plus large du terme <em>open data<\/em>.<\/p>\n<h1>2\/ L\u2019<em>open data<\/em> au sens large\u00a0: des nouvelles m\u00e9thodes de traitement de l&rsquo;information<\/h1>\n<p>Le terme <em>open data <\/em>peut aussi \u00eatre employ\u00e9 de mani\u00e8re large pour englober les donn\u00e9es brutes mises \u00e0 disposition et leur traitement avec des m\u00e9thodes extr\u00eamement avanc\u00e9es : algorithmes, <em>data science<\/em>, <em>data mining<\/em>, intelligence artificielle, <em>machine learning<\/em>\u2026 la sophistication des termes entretient une totale confusion car, comme dans une \u0153uvre de science-fiction, la technologie se m\u00eale parfois aux fantasmes.<\/p>\n<p>Pour se d\u00e9partir d\u2019une approche simplement intuitive, il faut revenir aux fondements des sciences et technologies actuellement employ\u00e9es\u00a0: ces traitements se fondent sur des approches probabilistes qui n\u2019ont rien r\u00e9volutionn\u00e9 dans le champ th\u00e9orique mais qui profitent de capacit\u00e9s de stockage et de calcul consid\u00e9rablement am\u00e9lior\u00e9es ces derni\u00e8res ann\u00e9es. Ce qui semble nouveau, c&rsquo;est que ces nouvelles capacit\u00e9s ont permis des traitements massifs de donn\u00e9es par une approche corr\u00e9lative et inductive au d\u00e9triment des approches\u00a0 causales et descriptives : ainsi, plut\u00f4t que de tenter de quantifier le r\u00e9el et de le mod\u00e9liser, l\u2019exploitation de grands ensembles de donn\u00e9es sont d\u00e9sormais cens\u00e9s r\u00e9v\u00e9ler des ph\u00e9nom\u00e8nes complexes par la pr\u00e9sence de corr\u00e9lations auparavant imperceptibles[<a class=\"_ps2id\" href=\"#note-1\" data-ps2id-offset=\"\">1<\/a>].<\/p>\n<p>Dans le champ de l\u2019exploitation des d\u00e9cisions de justice, les d\u00e9bats sur l\u2019<em>open data<\/em> se sont donc aussi port\u00e9s sur l\u2019exploitation des donn\u00e9es mises \u00e0 disposition avec ces approches inductives (voire pr\u00e9dictives) : pourrait-on r\u00e9v\u00e9ler de la masse des d\u00e9cisions un sens nouveau de l\u2019application de la loi\u00a0? En se fondant sur le nom des juges, arriverait-on \u00e0 r\u00e9v\u00e9ler des biais et un manque d\u2019impartialit\u00e9\u00a0?<\/p>\n<h1>3\/ L\u2019<em>open data<\/em> en tant que politique publique<\/h1>\n<p>Et c\u2019est l\u00e0 o\u00f9 l\u2019<em>open data<\/em> n&rsquo;est plus un simple instrument de transparence mais devient porteur d\u2019une v\u00e9ritable politique publique aux termes de laquelle se d\u00e9gagerait une \u00ab\u00a0norme issue du nombre\u00a0\u00bb, s\u2019imposant quasiment aux juges\u00a0 comme une nouvelle source du droit. Une politique o\u00f9 le juge, se sachant scrut\u00e9, serait plus sensible \u00e0 la discipline impos\u00e9e par les juridictions sup\u00e9rieures.<\/p>\n<p>A ce stade, il ne s\u2019agit pas de se prononcer pour ou contre de nouveaux projets de fonctionnement de la m\u00e9canique de production des d\u00e9cisions (ce champ d\u2019opportunit\u00e9 appartient \u00e0 un d\u00e9bat public d\u00e9mocratique pour savoir ce que l\u2019on veut faire du syst\u00e8me judiciaire), mais de constater que les objectifs recherch\u00e9s se fondent sur des approches parfois discut\u00e9es entre les experts (citons par exemple la distinction connue entre les m\u00e9thodes bay\u00e9siennes les m\u00e9thodes fr\u00e9quentistes depuis le si\u00e8cle des Lumi\u00e8res[<a class=\"_ps2id\" href=\"#note-2\" data-ps2id-offset=\"\">2<\/a>]).<\/p>\n<p>En annon\u00e7ant que les juges deviendraient \u00ab\u00a0encagoul\u00e9s\u00a0\u00bb [<a class=\"_ps2id\" href=\"#note-3\" data-ps2id-offset=\"\">3<\/a>] du fait de l\u2019anonymisation (ou la \u00a0<a href=\"https:\/\/fr.wikipedia.org\/wiki\/Pseudonymisation\" target=\"_blank\" rel=\"noopener noreferrer\">pseudonymisation<\/a>) de leurs noms dans les bases de donn\u00e9es brutes ouvertes, il y a donc une erreur de compr\u00e9hension majeure qui conduit \u00e0 occulter le r\u00e9el d\u00e9bat\u00a0qui devrait imp\u00e9rativement s\u2019op\u00e9rer. Estime-t-on s\u00e9rieusement que nous sommes aujourd\u2019hui en mesure de cr\u00e9er du sens \u00e0 partir de m\u00e9thodes inductives sur la base de d\u00e9cisions juridictionnelles dont on conna\u00eet les m\u00e9rites mais aussi les d\u00e9fauts\u00a0? D\u00e9fauts parmi lesquels on pourrait citer le caract\u00e8re lapidaire ou obscur de certaines motivations\u2026 Par ailleurs, traiter le nom des juges ainsi ne conduirait-il pas \u00e0 imaginer dans de possibles corr\u00e9lations des faits n\u2019ayant aucun fondement s\u00e9rieux : par exemple des droits de garde plus fr\u00e9quemment attribu\u00e9s aux m\u00e8res ne r\u00e9v\u00e8lent pas n\u00e9cessairement un parti pris du magistrat.<\/p>\n<p>Les annonces proph\u00e9tiques, comparant par exemple la justice aux majors des industries musicales des ann\u00e9es 2000 ou annon\u00e7ant la disparition de la justice si elle ne s&rsquo;hybridait pas avec les m\u00e9thodes probabilistes, sont donc \u00e0 prendre avec recul. Penser une politique d\u2019<em>open data<\/em> pour la justice impose un recours \u00e0 des approches pluridisciplinaires scientifiquement fond\u00e9es (droit, th\u00e9orie du droit, \u00e9conomie, sociologie, math\u00e9matiques, statistiques, informatique), nourries de d\u00e9bats et d\u2019exp\u00e9rimentations, \u00e0 m\u00eame d\u2019enrichir un d\u00e9bat public \u00e9clair\u00e9. En somme, \u00eatre en mesure de choisir collectivement dans quel monde nous souhaitons vivre.<\/p>\n<hr \/>\n<p><strong>Aller plus loin ?<\/strong><\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"size-thumbnail wp-image-73 alignleft\" src=\"http:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/02\/IMG_1171-150x150.jpg\" alt=\"\" width=\"150\" height=\"150\" srcset=\"https:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/02\/IMG_1171-150x150.jpg 150w, https:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/02\/IMG_1171-100x100.jpg 100w\" sizes=\"auto, (max-width: 150px) 100vw, 150px\" \/><a href=\"https:\/\/radio.amicus-curiae.net\/podcast\/open-data-donnees-ouvertes-pour-monde-ouvert-ou-totalitaire\/\" target=\"_blank\" rel=\"noopener noreferrer\">Retrouvez l\u2019entretien avec Fran\u00e7ois Paych\u00e8re au sujet de l\u2019<em>open data<\/em> sur le podcast \u00a0des temps \u00e9lectriques, disponible sur Amicus Radio.<\/a><\/p>\n<hr \/>\n<p><strong>Notes<\/strong><\/p>\n<p>[1]<a id=\"note-1\"><\/a> <a href=\"https:\/\/www.wired.com\/2008\/06\/pb-theory\/\" target=\"_blank\" rel=\"noopener noreferrer\">C. Anderson, The end of theory. The data deluge makes the scientific method obsolete, Wired, 2008<\/a>.<br \/>\n[2]<a id=\"note-2\"><\/a> Voir par exemple <a href=\"http:\/\/www.christian-faure.net\/2013\/08\/31\/deux-visages-du-calcul-des-probabilites-bayesiens-et-frequentistes\/\" target=\"_blank\" rel=\"noopener noreferrer\">C. Faur\u00e9, Deux visages du calcul des probabilit\u00e9s : bay\u00e9sien et fr\u00e9quentiste, 2013.<\/a><br \/>\n[3]<a id=\"note-3\"><\/a> <a href=\"http:\/\/lestempselectriques.net\/wp-content\/uploads\/2018\/04\/Dbvo-ahXkAAxeF6.jpg\" target=\"_blank\" rel=\"noopener noreferrer\">Des juges encagoul\u00e9s ?, Le Canard Encha\u00een\u00e9, 25 avril 2018.<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Donn\u00e9es brutes, m\u00e9thodes probabilistes et politique publique : les trois visages de l&rsquo;open data Le projet de loi de programmation 2018-2022 et de r\u00e9forme pour la justice, pr\u00e9sent\u00e9 le 20 avril 2018 en Conseil des ministres, propose de r\u00e9\u00e9crire dans son article 19 les dispositions introduites par les articles 20 et 21 de la loi&hellip; <a class=\"read-more-link\" href=\"https:\/\/lestempselectriques.net\/index.php\/2018\/04\/27\/lopen-data-en-trois-definitions\/\">Plus&#8230;<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[15],"tags":[8,7,6,5],"coauthors":[17],"class_list":["post-171","post","type-post","status-publish","format-standard","hentry","category-billetsetudes","tag-big-data","tag-data","tag-donnees","tag-open-data"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/posts\/171","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/comments?post=171"}],"version-history":[{"count":31,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/posts\/171\/revisions"}],"predecessor-version":[{"id":1032,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/posts\/171\/revisions\/1032"}],"wp:attachment":[{"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/media?parent=171"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/categories?post=171"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/tags?post=171"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/lestempselectriques.net\/index.php\/wp-json\/wp\/v2\/coauthors?post=171"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}