Open data
L’open data consiste en la mise en place de dispositifs dans lesquels des données produites dans le cadre de l’activité par une organisation publique ou privée sont éditorialisées et grâce auxquelles des publics sont invités à participer à la production de données ou à la conception de services.
Le Corf, J, Labelle, S. (2022). Open data. In G. Petit, L. Blondiaux, I. Casillo, J.-M. Fourniau, G. Gourgues, S. Hayat, R. Lefebvre, S. Rui, S. Wojcik, & J. Zetlaoui-Léger (Éds.), Dictionnaire critique et interdisciplinaire de la Participation, DicoPart (2ème édition). GIS Démocratie et Participation.
https://www.dicopart.fr/open-data-2022
L’expression open data recouvre deux sens, d’une part, l’ouverture des données (politique publique ou stratégie), et d’autre part, les données ouvertes (objet concret de cette politique). En France, les politiques publiques d’ouverture des données s’inscrivent en continuité des politiques d’accès citoyen aux documents administratifs et aux informations publiques. Celles-ci ont été traduites par la loi CADA en 1978 et par l’article 3 du projet de loi sur la société de l’information en 2001 (proposant déjà une « diffusion des données publiques numérisées »). Ces politiques ont connu une amplitude internationale grâce à la publicité faite au premier memorandum sur « la transparence » et « le gouvernement ouvert » publié par Barack Obama lors de sa prise de fonction du 20 janvier 2009 en tant que président des États-Unis, qui définissait le cadre d’une politique de publication des données publiques.
Les politiques d’ouverture des données concernent aussi bien les organisations publiques (par exemple, les institutions culturelles, les autorités administratives indépendantes, les collectivités territoriales et l’État) que privées (les associations comme les entreprises). Elles consistent en la publication sur un site web de jeux de données produits dans le cadre des missions de service public des organisations publiques ou de l’activité de l’organisation privée. En ce qui concerne les initiatives du secteur public, participant aux mutations de l’espace public, l’usage des données (alors considérées comme « biens communs ») est souhaité par les acteurs de ces politiques par toutes et tous : citoyen·nes, associations, entreprises. Ces politiques publiques de données se situent dans un cadre juridique évolutif, déterminant des principes et normes de mise en œuvre, qui impliquent certaines formes d’organisation. Elles affichent dans leurs discours et leurs dispositifs des objectifs pluriels : ambitions démocratiques par de nouvelles modalités de mise en œuvre des idéaux de « transparence » et de « participation », visées économiques par la stimulation de l’innovation, transformation des pratiques organisationnelles des administrations publiques. Dans leurs perspectives démocratiques, les politiques d’ouverture des données entrent en résonnance avec le thème de la participation qui regroupe les activités par lesquelles les citoyen·nes sont habilités à entrer en contact avec l’univers du pouvoir en respectant certaines contraintes et celles de la citoyenneté active. Cela se traduit par la transparence et la participation qui constituent des « motifs », c’est-à-dire des termes qui promeuvent des valeurs partagées et revendiquent la capacité d’action des organisations. Nos enquêtes menées depuis 2010 (recherches individuelles ou collectives) permettent d’approfondir certaines logiques sociales inhérentes à ces deux motifs de l’ouverture des données. Ces motifs se figurent dans des discours et des dispositifs valorisant l’engagement au travers des processus d’éditorialisation ou du crowdsourcing.
Motif de la transparence, éditorialisation et publics de l’ouverture
La transparence de l’action publique est un motif fondateur de la démocratie et de l’ouverture des données, renouvelant la relation entre institutions publiques et citoyen·nes. Supposément désirée par toutes et tous et par opposition aux notions d’opacité et de secret, elle s’établit sur des données publiques ou plus largement d’intérêt général, produites par des acteurs délégataires de services publics ou privés (au sens défini par la loi pour une République numérique promulguée le 7 octobre 2016), en éclairant le fonctionnement des services et activités des institutions publiques. La sociologie des organisations a bien mis en exergue le fait que la maîtrise de la communication et des informations renvoie directement à des enjeux de pouvoir. Conséquemment, le partage de l’information, et ici des données, s’affilie à l’idée d’un certain partage du pouvoir. En outre, la transparence repose également sur l’idée que la circulation d’informations, permettant d’éclairer le citoyen·ne, est un préalable et un processus de la démocratie, conditionnant sa potentielle participation sur divers problèmes publics. L’idéal de transparence, corollaire de la libre circulation des informations, se traduit par une politique de l’offre de données : ces dernières sont réunies et publiées sur des dispositifs informatisés que ce soient des portails, des entrepôts ou des sites spécialisés. Par exemple, au niveau national français et après quelques initiatives pionnières soutenues par des collectivités territoriales, l’administration Étalab, créée en 2011, implémente le portail data.gouv.fr. En outre, le choix de centraliser l’accès des données dans un même espace éditorial contribue à homogénéiser les publics destinataires des données. Ainsi, les données font, dans ces dispositifs, l’objet d’une éditorialisation qui consiste concrètement en la production de métadonnées, de rubricages, de diversité des fichiers, de visualisations intégrées, etc. En contexte d’open data, ce travail d’éditorialisation ne distingue pas les différents publics qu’ils soient citoyen·nes, scolaires ou encore expert·es. Ce mode d’accès s’adresse à un grand public générique et s’inscrit dans la continuité des logiques structurantes de la communication publique observées sur des campagnes de prévention routière ou de santé publique. Dans une démarche d’éditorialisation différente, le programme Infolab de la Fondation Internet Nouvelle Génération (Fing), conduit de 2012 à 2018, suggérait à certaines collectivités territoriales de ne pas créer de dispositif dédié à l’ouverture des données, mais de les associer aux informations et articles thématiques de leur site web existant. La proposition consistait à situer les données publiques dans des espaces de sens spécifiés afin de favoriser leur consultation, leur compréhension et leur usage. Les choix d’éditorialisation dépendent d’arbitrages qui définissent les logiques d’accès et par là, les publics qui peuvent agir et participer effectivement à ces politiques d’ouverture. Dans tous les cas, le processus éditorial de réutilisation des données repose sur un principe de détachement, qui consiste « à sortir des données de leur contexte initial de production pour leur offrir un nouveau cadre d’interprétation et de traitement dans de nouveaux contextes sociaux » (Labelle et Le Corf, 2012). L’administration publique requalifie son rôle et sa fonction dans l’organisation des services publics, à partir de sa capacité à transférer à des tiers (appelés à participer) les éléments nécessaires à la production de services publics ou privés (par exemple, les données travaillées par des agences immobilières pour guider leurs client·es dans la détermination du prix de leur bien immobilier). Ce partage, voire, dans certains cas, ce report de responsabilités (qui peuvent relever de l’action publique) sur des praticien·nes ou des organisations qui revendiquent des compétences dans la programmation et le développement vise à soutenir de potentiels nouveaux usages (qui n’ont pas été prévus par les producteurs de données). Cette logique se matérialise via des dispositifs socio-techniques qui instituent des formes politiques spécifiques, faisant écho à certaines caractéristiques de la philosophie du néolibéralisme décrites en partie par Barbara Stiegler (2019) : adaptation à une transformation permanente, atténuation des différences entre public et privé, promotion de la responsabilité individuelle et d’un pouvoir diffus et multicentrique. Cette délégation se manifeste par les interpellations de ces publics qui sont tour à tour invités à « rechercher », « aspirer », « réutiliser », « participer », « partager ». Ces verbes d’action, souvent présents dans leur forme impérative sur les portails d’accès aux données des collectivités territoriales ou de l’État, renvoient à « l’impératif participatif ».
La participation des publics de données fait dans ce contexte plus généralement écho aux caractéristiques théoriques du concept même d’éditorialisation, défini comme une « collectivité ouverte » ne suivant pas de « protocole prédéfini », un processus collectif inscrit dans une « dynamique de mouvement » composé de « différentes étapes décidées au fur et à mesure » (Vitali-Rosati, 2020).
Motif de la participation-crowdsourcing, au-delà de la communication publique
La participation est une notion triviale (Jeanneret 2014 : p.20), ce qui vise à décrire ce processus de communication dans sa prétention à renforcer la capacité des objets (ici des données) à circuler et à être appréhendés par des publics. Nombre d’acteurs engagés dans l’ouverture des données s’en saisissent pour désigner des actions de médiation ou de communication publique auprès de citoyen·nes « ordinaires », afin de susciter une meilleure compréhension et adhésion à ces politiques de données. Il s’agit le plus souvent d’expliquer en quoi les données peuvent éclairer dans des processus de validation des décisions ou dans des usages du quotidien (données de pollution ou d’éclairage public pour orienter les piéton·nes dans leurs itinéraires). Les politiques de données ne mobilisent pas ou peu de dispositifs de concertation qui permettraient d’attribuer un certain rôle aux citoyen·nes pour définir leurs évolutions. Ce public reste en posture d’usager final, susceptible de consommer des services, et en cela, participer à la modernisation de l’action publique. Plus rarement, des initiatives visent à recueillir son avis dans la conception d’une infrastructure de données ou sur une application inachevée, avant de poursuivre et finaliser son développement.
Cela étant, dans certaines situations, la logique de transparence interagit de manière plus effective avec celle de la participation des publics de données (Lehmans, 2018), constituant un postulat central des projets d’open data. Les formes d’engagement d’autres publics spécifiques, les « réutilisateurs » des données ouvertes (développeur·euses, data scientists, journalistes de données…), peuvent être qualifiées de participation-crowdsourcing. Cette notion de crowdsourcing (contraction des mots crowd - la foule - et outsourcing – externalisation) a été vulgarisée par Jeff Howe en 2006 dans la revue Wired, qui la définit comme l’acte de déléguer une tâche à un groupe indéfini, souvent sous la forme d’un appel à participation. Ces pratiques d’innovation, soutenant divers modèles économiques et régimes de coopération, s’apparentent à des formes de management public. Elles se développent dans l’administration et notamment dans le secteur culturel (Severo et Thuillas, 2022). Appliqué au niveau local, le crowdsourcing territorial peut se définir comme « production participative », qui tend autant à « se servir » de la contribution d’un type de citoyen·nes, qu’à les « servir » plus largement au nom de l’intérêt général. Dans ces processus, le développeur informatique apparaît comme public-cible, ce qui en fait la figure centrale et qui contraste avec certains discours institutionnels plus englobants en faveur de la transparence et mettant en avant un plus grand public destinataire. Professionnel·le salarié dans une start-up, indépendant·e ou amateur·rice, ce développeur·euse s’investit en tant que citoyen·ne engagé pour l’intérêt général, par sa maîtrise des processus d’éditorialisation de l’administration et soucieux de « rendre service » aux habitant·es dans leur quotidien, la problématique du modèle économique lié à cet engagement étant souvent secondaire (Le Corf, 2016). Sa participation effective est d’autant plus cruciale que « la valeur n’est pas intrinsèque aux données ouvertes, mais qu’elle découle des transformations des données » (Dymytrova et Paquienséguy, 2020 : 13). Cette participation revendiquant sa forme d’« intelligence collective » (Badouard, 2017) peut être encouragée par le biais d’événements (hackhatons ou autres concours de réutilisations de données ouvertes), qui « servent à rendre concrets en donnant à l’ouverture à la fois le corps des participants et la consistance des productions » (Labelle, 2020 : 73).
Ces espaces de participation peuvent être soutenus par des institutions ou auto-gérés (par des individus et collectifs) dans les interstices de l’action publique, renvoyant à une « démocratie sauvage », par opposition à une « démocratie d’élevage » (Mermet, 2007). L’open data « associe une forme de délégation d’un pouvoir depuis une institution vers la société civile (la mise à disposition des données sans cadrage préalable de leur réutilisation), et des formes d’auto-organisation communautaire (la manière dont des communautés thématiques se saisissent des données dans le cadre de stratégies de mobilisation qui leur sont propres) » (Badouard 2017 : §50). Dès lors, la valorisation des données ouvertes au sein de dispositifs participatifs ou par l’implication citoyenne en dehors des institutions, se pose principalement en termes de data-services : elle est matérialisée par la conception de dispositifs pour répondre à un usage spécifique et contextualisé au sein du territoire (applications d’aide à la mobilité agrégeant des données de divers opérateurs de transport) ou des visualisations info-communicationnelles venant appuyer des processus d’aide à la décision ou de débat (tableaux de bord sur l’épidémie de COVID-19 grâce à la réutilisation de données de Santé Publique France).
Plusieurs cas d’usage de productions faisant appel à la participation de publics fournissent une idée de la manière dont les savoirs citoyens sont convoqués en situation. Les « cartoparties » s’inspirant du modèle contributif d’OpenStreetMap consistent à faire produire ou préciser des données de localisation : évolution des positions de mobiliers urbains ou d’aménagements publics (ronds-points…), recensions des arbres remarquables, y compris au sein d’espaces privés (dans ce cas, le crowdsourcing est la seule condition d’accès à cette donnée privée). Autre exemple, l’amélioration des bases fiscales s’appuie sur les connaissances de citoyen·nes de façon à détecter des incohérences parmi les valeurs locatives cadastrales ou améliorer la détermination de locaux de référence. Enfin, la mise en place de capteurs dans des lieux de vie constitue les pratiques quotidiennes et anodines de leurs habitant·es (allumer la lumière, faire couler de l’eau) en contributions à l’amélioration de l’habitat par leur enregistrement en données. Dans l’approche pragmatiste de la « participation matérielle » (Marres, 2012), toutes ces pratiques peuvent être qualifiées de démocratiques. Elles questionnent le périmètre de l’open data et son actualisation, ainsi que la dimension socio-politique de l’engagement des participants.
***
Les démarches d’ouverture des données permettent d’observer une rupture avec une participation politique et l’idéal délibératif habermassien impliquant davantage un citoyen·e « ordinaire », que l’on retrouve dans d’autres espaces de communication relevant d’une « démocratie électronique » tels que les forums (Wojcik, 2011). Si le terrain de l’open data rejoint une nouvelle offre de participation dédiée principalement aux réutilisateurs de données, il convient de remarquer le caractère trivial (Jeanneret, 2014) des formes de citoyenneté active encouragées, ainsi que l’imposition d’un modèle de « participation matérielle » (Marres, 2012). Ce concept traduit une volonté d’inclure des publics ciblés à agir sur certaines dimensions d’un problème donné. La participation est marquée par le rôle prépondérant accordé à la dimension matérielle des objets (fussent-ils ici sociotechniques comme des infrastructures de données) dans l’activation des publics et à leur fonction de médiation dans l’organisation du social. Cette perspective reflète une visée gestionnaire et productive de la « participation citoyenne », bien que cet objectif reste parfois loin des espérances. En effet, une non-participation s’observe dans certaines initiatives puisqu’en dépit d’un nombre important de jeux de données rendues disponibles, le nombre d’applications accessibles, visibles, publiées exploitant les données ouvertes reste assez limité (Dymytrova et Paquienséguy, 2020 : 1). Les dispositifs participatifs de l’open data demeurent donc relativement en recherche de leurs publics : rendre les données ouvertes ne suffit pas à générer leur réutilisation et suppose le partage d’une culture des données par le plus grand nombre.
Badouard, Romain. 2017. « Open government, open data : l’empowerment citoyen en question ». Dans Ouvrir, partager, réutiliser. Regards critiques sur les données numériques. Sous la direction de Clément Mabi, Jean-Christophe Plantin et Laurence Monnoyer-Smith, Paris, Éd. de la Maison des sciences de l’homme.
Dymytrova, Valentyna., Paquienséguy, Françoise. 2020. « Du traitement des données à la création de valeur : comprendre les pratiques professionnelles des réutilisateurs des données ouvertes », Des données à la décision, ISTE OpenScience, n°1, Vol.3.
Jeanneret, Yves. 2014. Critique de la trivialité. Les médiations de la communication, enjeu de pouvoir, Paris : Éditions Non Standard.
Labelle, Sarah ; Le Corf, Jean-Baptiste. 2012. « Modalités de diffusion et processus documentaires, conditions du "détachement" des informations publiques. Analyse des discours législatifs et des portails open data territoriaux », Les Enjeux de l'Information et de la Communication, vol. 13/2, n° 2, pp. 209-59.
Labelle, Sarah. 2020. Médiations & pouvoirs de l’agir ingénieur. Mythes et infrastructures des politiques de données, Mémoire d’Habilitation à diriger des recherches en Sciences de l’Information et de la Communication, Université Paris-Est.
Le Corf, Jean-Baptiste. 2016. « Les pratiques d’innovation de services des développeurs web dans les territoires : le cas des projets Open Data », Communication & Organisation, n° 50, pp. 123-136.
Lehmans, Anne. 2018. « Les réinventions de la démocratie à l’aune de l’ouverture des données : du discours de la participation aux contraintes de la gouvernance », Les enjeux de l’information et de la communication, 2018/2 N° 19/2, pp. 135-146.
Marres, Noortje. 2012. Material Participation : Technology, The Environnement and Everyday Publics, Londres : Palgrave Macmillan.
Mermet, Laurent. 2007. « Épilogue. Débattre sans savoir pourquoi : la polychrésie du débat public appelle le pluralisme théorique de la part des chercheurs ». Dans Le débat public : une expérience française de démocratie participative. Sous la direction de Martine Revel (et al), Paris, La Découverte, pp. 368-380.
Severo, Marta ; Thuillas, Olivier. 2022. « Participation culturelle et plateformes numériques », Hybrid, n° 8.
Stiegler, Barbara. (2019). « Il faut s'adapter ». Sur un nouvel impératif politique, Gallimard.
Vitali-Rosati, M. 2020. « Pour une théorie de l’éditorialisation ». Humanités numériques, n° 1.
Wojcik, Stéphanie. 2011. « Prendre au sérieux la démocratie électronique. De quelques enjeux et controverses sur la participation politique en ligne ». Dans Internet, machines à voter, démocratie. Sous la direction de Elsa Forey et Christophe Geslot, L’Harmattan, pp. 111-141.