Première partie : Ce projet, qui affiche des ambitions certaines au moins sur le plan des principes, porte sur plusieurs grandes thématiques, dont l’ouverture, la « libération » des données publiques produites ou collectées par les administrations françaises et les concessionnaires de services publics.

loi-numerique-chapo_vignette

un processus législatif innovant

Ce projet de loi « numérique », porté par le gouvernement et la secrétaire d’Etat au numérique Axelle Lemaire, était attendu depuis 3 ans. Il porte l’ambitieux projet de fonder une « République numérique », en partant du principe, de l’évidence devrait-on dire, que l’avenir économique et social du pays est numérique. La loi viendra donc s’inscrire dans une démarche plus vaste et plus ancienne de transformation numérique de l’Etat (dématérialisation des procédures, Open Data, services applicatifs en ligne) et d’encouragement aux secteurs innovants et aux entreprises « digitales ».

Après l’intéressant rapport Collin & Colin sur la fiscalité du numérique, qui avait illustré les effets de la mutation numérique en cours, cette loi constitue un pas supplémentaire dans l’adaptation institutionnelle et légale du pays pour permettre l’essor d’une nouvelle économie ouverte et connectée, accompagner la crise des anciens modèles marchands, et employer au mieux les nouveaux outils technologiques.

Les motifs du projet de loi soulignent que la démarche de ses promoteurs est double : modifier les infrastructures étatiques pour donner corps à une « République numérique » en phase avec les pratiques et outils de son temps, d’une part, et instaurer une « économie de la donnée » pertinente, respectueuse de la personne et économiquement efficace, d’autre part.

S’agit-il de répondre aux besoins de « capacitation » qui signe l’essoufflement des modèles économiques classiques ? S’agit-il de donner consistance à cet « habeas corpus numérique » rendu nécessaire par la prolifération des menaces sur l’identité de chacun ? Rien ne permet encore de le dire, le projet restant en-deçà de certaines propositions résolument tournées vers l’économie contributive et ouverte, mais on ne peut que saluer un net volontarisme et une démarche associant les citoyens, associations et « experts » à la rédaction du texte.

De fait, le texte évolue presque chaque semaine, compte tenu des contributions jusqu’au 18 octobre sur le site www.republique-numerique.fr, et certaines dispositions sur la gratuité des données publiques ont disparu entre sa première version et celle présentement analysée (mais ont été renvoyées au projet de loi Valter sur la « gratuité et la réutilisation des informations sur secteur public ».

D’aucuns observent cependant que la multiplication des textes de lois traitant des mêmes thématiques est évidemment source de confusion : comment est-il possible de préparer un texte sur la « gratuité de la réutilisation des données publiques » n parallèle d’un texte sur « l’ouverture et la diffusion des données publiques » ?

logo_insee

Et comment est-il possible de prévoir dans le premier que certaines administrations (comme l’INSEE) pourront continuer à monnayer leurs données, par exception au principe de gratuité posé, pendant que l’autre texte, sur la République Numérique, ne prévoit pas d’exception ? Cet impressionnisme législatif semble s’expliquer par la résistance de certaines administrations, vent debout contre l’idée de perdre les mannes financières constituées par la revente/location de leurs données.

Le rapporteur du texte sur la gratuité prend pourtant l’exemple de l’IGN pour montrer qu’en renonçant à monétiser ses cartes géographiques et en les ouvrant à tous, l’IGN avait permis d’accroître considérablement l’utilisation des données, générant plusieurs centaines de millions de valeur… De plus l’Open Data semble aussi être un enjeu de concurrence entre ministères, ce qui ne simplifie pas son déploiement effectif.

Dans sa forme actuelle, le texte prétend instaurer les conditions :

  • D’une liberté accrue pour la circulation des données et du savoir (ce qui pose la question de la compatibilité de cet objectif avec les propriétés intellectuelles traditionnelles d’une part, et la protection des données personnelles d’autre part, qui sont parfois perçues à tort ou à raison comme des obstacles à cette libre circulation) ;
  • D’une égalité de droits pour les usagers du net (ce qui pose des questions relatives aux modèles économiques viables sur les réseaux, à la neutralité des acteurs du net (et pas seulement des FAI), au droit à l’oubli et à la protection de la vie privée, etc.) ;
  • D’une ouverture optimale au bénéfice des internautes : les règles d’accessibilité doivent se généraliser, et au-delà, le droit à une connexion web est en passe d’être promu, non encore au niveau constitutionnel (même si on peut considérer que les débats et la décision du Conseil Constitutionnel relative à la loi Hadopi ont déjà entériné ce point), mais déjà au niveau légal.

Dans le cadre d’une approche originale, et cohérente avec les principes promus dans le projet de loi, le gouvernement a lancé des consultations préparatoires auprès des entreprises et administrations (repris dans le rapport du Conseil National du Numérique du 18 juin 2015) puis a proposé une consultation participative permettant à tout un chacun de s’exprimer sur le projet (entreprises, individus, associations, etc.).

Il ne s’agit pas réellement d’une « co-création législative » ni de la « démocratie directe » parfois évoquée, car évidemment le législateur restera seul maître et responsable de la teneur finale de la loi, mais cette consultation a le mérite de soumettre aux citoyens des questions qui, à l’opposé de la technicité dont on les croit parées, les concernent pleinement et conditionnent leur avenir.

Il est donc question d’accompagner la « transition numérique » de la société française, en n’oubliant aucune des questions à traiter – et elles sont nombreuses : protection des données personnelles, facilitation de l’innovation et compétitivité économique sur les réseaux, ouverture et libération des données publiques, protection des créateurs et libre circulation du savoir et de la culture, neutralité du net, droit à l’oubli, etc. Ces questions mettent en jeu des principes fondamentaux, tels que la vie privée, le secret des correspondances, la liberté d’expression, et c’est un truisme d’affirmer que les équilibres entre principes constitutionnels sont à repenser à l’aune de cette mutation numérique généralisée.

En son état actuel, le projet de loi traite de thématiques plutôt tournées vers les données personnelles. Il est vrai que la propagation du cloud (grand public et professionnel), le déploiement des objets connectés, et le développement des « business models » fondés sur la donnée, ont rendu inévitable la nécessité de légiférer sur l’identité numérique et ses protections.

Le rôle des administrations françaises est central dans la mise en œuvre de cette « numérisation » de la République. Les services publics et le principe d’ouverture des données sont donc à l’honneur dès les premiers articles de la loi.

1. L’économie de la donnée numérique

Il s’agit là d’entériner la nouvelle réalité économique, fondée sur la data, et de lui donner un corps légal. Les débats ont été nombreux, ces dernières années, qui ont porté sur l’équilibre à trouver entre la protection des données personnelles, le développement du big data, l’exploitation des données techniques, et l’éclosion de modèles économiques fondés sur la traçabilité des consommateurs ou usagers, et la réexploitation des données recueillies.

Cette prise de conscience n’est pas neuve, puisque la première législation protégeant les données personnelles, au titre de la vie privée, est apparue en 1978 (loi du 6 janvier 1978 dite « Informatique & Libertés ») ainsi que la première législation instaurant le droit pour le citoyen d’accéder aux documents de l’administration (loi du 17 juillet 1978 dite « CADA »).

Le projet de loi veut compléter ces législations qui, en dépit des évolutions apportées notamment en 2004 et 2005 pour les adapter à la législation européenne, restent en deçà des exigences économiques et sociales modernes.

  • L’ouverture des données publiques produites par les administrations, un principe « par défaut »

Les administrations disposeront de 2 années à compter de l’entrée en vigueur de la loi pour « libérer » leurs données publiques, en particulier « les bases de données qu’elles produisent ou qu’elles reçoivent », ainsi que les données dont la publication présente un intérêt économique, social ou environnemental.

cadaIl s’agit de mettre en place ici le principe inverse de la loi CADA de 1978, qui autorisait un administré à obtenir personnellement communication d’un document détenu ou produit par l’administration lorsqu’il y trouvait un intérêt légitime. Désormais c’est le principe inverse qui devra prévaloir, pour toutes données produites par les administrations via les financements publics. D’ailleurs, tous les documents prévus par la loi CADA devront être ouverts en format standard au plus tard 2 ans après l’entrée en vigueur de la loi, ce qui témoigne d’une réelle volonté en ce sens.

La réforme concerne l’Etat, les collectivités territoriales et les personnes chargées d’un service public, et porte sur tout type de donnée prévu par la loi CADA. Les administrations sont priées de numériser leurs données et de les proposer en « format ouvert », une exigence élémentaire dès lors qu’il s’agit d’ouvrir des données et d’en autoriser le réemploi, mais qui n’est apparue que tardivement dans le projet de loi.

La nomenclature des documents qui deviendront librement accessibles n’est pas encore stabilisée. Le projet vise les « bases de données » que les administrations produisent ou reçoivent, et les « données dont la publication présente un intérêt économique, social ou environnemental » (ce qui est potentiellement sans limite).

On a un temps parlé d’ouvrir également les codes sources des logiciels développés par ou pour l’administration, dès lors que la CADA a estimé dans un avis du 8 janvier 2015 que « les fichiers informatiques constituant le code source sollicité, produits par la direction générale des finances publiques dans le cadre de sa mission de service public, revêtent le caractère de documents administratifs » au sens de la loi de 1978 et pouvaient donc être communiqués au requérant.

Le projet de loi devrait donc généraliser cette position, et mettre au pas certaines administrations récalcitrantes (comme précisément le fisc), mais il est certain que des exceptions perdureront, notamment pour les documents revêtus d’un secret lié à la défense nationale ou la sécurité publique. Le sort des codes sources logiciels n’est pas encore scellé, et les discussions se poursuivent. L’on voit mal cependant en quoi les logiciels produits par l’administration pourraient échapper à ce principe d’ouverture et de réutilisation.

A ce stade cependant, le projet ne dit pas clairement qui décidera de l’intérêt « économique, social ou environnemental » des données publiables, ni qu’elles devront nécessairement être de formats interopérables et lisible par toute machine…

S’agissant de la licence encadrant la diffusion des données, le projet précise toutefois que les principes de l’Open Data seront mis en œuvre. On peut donc considérer que ces données seront soumises à la « Licence Ouverte » conçue par l’hébergeur Etalab, qui autorise gratuitement et librement la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données, sous réserve de mentionner leur paternité initiale.

En revanche, il semble que l’appréciation de l’intérêt économique, social ou environnemental de la libération d’une donnée restera soumise à la décision de l’exécutif. Et on voit poindre de nombreuses exceptions, fondées classiquement sur des propriétés intellectuelles ou encore sur le fameux droit sui generis du producteur de bases de données, droit qu’il s’agit justement de « neutraliser », ou en tous cas d’aménager, pour permettre la rediffusion large des données ouvertes en Open Data.

Certains leviers de rentabilisation dont bénéficiait l’administration vont donc se tarir : on pense à des données publiques comme les numéros SIRENE produits par l’INSEE, qui ne peuvent pour l’heure être diffusés que via des licences propriétaires R2A ou R2B particulièrement coûteuses. De longue date, les acteurs économiques trouvaient invraisemblable que des valeurs créées grâce à l’impôt ne soient pas de facto remises en circulation au bénéfice de tous.

Mais alors le projet devrait comporter des précisions sur le sort des entreprises qui se sont spécialisées dans les prestations de sirétisation et d’enrichissement de fichiers en s’appuyant sur les licences propriétaires acquises auprès des administrations concernées, ce qui n’est pas le cas.

En toute hypothèse, on passe d’un système de commercialisation de certaines données publiques par les administrations elles-mêmes, à un système de libération généralisée des données publiques, sauf exceptions. Nul doute que certaines données resteront confidentielles et propriétaires, ne serait-ce que par renvoi à l’article 6 de la loi CADA qui liste les cas d’exception (secret défense, sécurité intérieure, secret industriel, vie privée, etc.) mais il s’agit indéniablement d’un pas en avant significatif.

Il est clair que c’est l’internet qui permet enfin de passer de l’ancien système de commercialisation individuelle et payante de la donnée publique, à un système de publication générale et gratuite au bénéfice de tous.

Mieux, cette ouverture généralisée se double d’un principe de libre réutilisation par toute personne qui le souhaite, à d’autres fins que le service public pour lequel elles ont été synthétisées ou collectées (article 2 du projet).

media_file_205

La base de données, au confluent de plusieurs régimes juridiques, et au coeur de l’économie numérique

Cela pose toutefois la question, régulièrement évoquée devant les juges, du droit sui generis du producteur de base de données (art. L.341-1 et s. du Code de la propriété intellectuelle), qu’on confond trop souvent avec le droit d’auteur qui peut protéger la structuration, si elle est originale, de ladite base. Par construction, c’est donc ce droit sui generis dont les administrations seraient privées au bénéfice d’un principe de publication généralisé, mais il conviendra de s’assurer qu’elles ne réimposeront pas de droit privatif, en arguant par exemple d’une originalité dans la conception de la base de données, pour limiter les effets de la réforme.

Le droit sui generis des articles L.341-1 et suivants du Code de la propriété intellectuelle nous semble éminemment incompatible avec le principe de l’Open Data et les règles de la licence ouverte, qui permettent notamment la réutilisation et/ou l’extraction de tout ou partir des bases de données ainsi ouvertes.

En effet on a déjà vu maintes fois, dans le secteur privé, la réapposition abusive de droits sur des œuvres élevées dans le domaine public (en prétextant des efforts de numérisation ou d’embasement, ou « copyfraud »). Les exceptions ne devront donc pas vider le principe de sa substance, sauf à engendrer un important contentieux entre les administrations et les personnes (morales ou physiques) désireuses de réexploiter ces données publiques.

  • Création d’un « service public de la donnée »

L’article 4 du projet érige en service public relevant de l’Etat le fait d’ouvrir et de permettre la réutilisation des données produites par les administrations. Un décret viendra préciser ensuite les « données de référence » qui seront concernées, et les administrations en charge de leur diffusion, ainsi que la qualité attendue des données fournies, en termes de précision, de format et de fraîcheur.

Les administrations produisent des données fondamentales (techniques, statistiques, scientifiques, écologiques, financières, juridiques, économiques, sociales, etc.), qui peuvent trouver de nombreux usages dans de nombreux secteurs (publics comme privés). Le gouvernement donne comme exemple les données produites par l’Institut National de l’Information Géographique et forestière, la base « adresses nationale » anciennement créée par la Poste, etc.

L’Etat et les administrations sont une source colossale d’informations réexploitables, encore faut-il qu’elles soient de qualité. Cependant le projet ne traite pas des responsabilités qui pourraient être encourues en cas de diffusion de données erronées par l’administration, et on peut craindre la naissance d’un contentieux administratif récurrent à ce sujet si l’administration ne se dote pas de solides ressources consacrées à la qualification et au contrôle de ses données.

  • Ouverture des données « d’intérêt général » liées aux services publics et aux aides publiques

Le principe général va également s’appliquer par défaut aux contrats de délégation de services publics (art. 5 du projet). Tout délégataire d’un service public devra fournir à la personne de droit public les données produites ou collectées dans le cadre de l’exploitation du service public, dans un standard ouvert permettant facilement leur réutilisation.

Ainsi, l’exploitation d’un service public ne pourrait plus être envisagée comme le moyen pour le délégataire, personne de droit privé, de constituer des bases de données commercialement réexploitables à son seul profit. Des précisions restent toutefois à apporter, car au gré des versions, l’obligation ne semble pas toujours concerner les délégataires de services publics de droit privé.

De même, les associations ou entreprises recevant des subventions publiques dépassant le million d’euros, devront diffuser les données issues de leur activité en format standard et ouvert, ce qui prolonge et renforce considérablement la loi du 12 avril 2000 qui prévoyait déjà la communication, sur demande toutefois, des comptes de tels entités subventionnées par l’impôt.

(à suivre)