J’ai assisté à une présentation de Valérie Peugeot sur les enjeux liés à l’open data en juin 2013 que j’ai relatée par ailleurs.
Dans cet article, elle aborde avec clarté la problématique actuelle de ce que l’on appelle big data et dont elle se méfie (mon souvenir). Pour elle il s’agit de concilier deux aspects antagonistes aujourd’hui, et également légitimes : d’un côté le besoin d’innovation permis par la mise à disposition et le traitement mathématique de ces stocks de données qui vont indéniablement améliorer le quotidien de l’humanité (et l’inverse est également possible - logique du pharmakon) ; de l’autre côté la visibilité accrue, en temps réelle des données personnelles. Sur cette question, le problème posé est bien plus dans la facilité d’accès aux données personnelles à des cercles hyper-étendus et classiquement non-autorisés comme aurait dit Coluche que dans leur exposition.
D’où la question (perso) à se poser plutôt que celle du privé, c’est celle de "l’autorisé à" et donc de la proximité/intimité à l’autre. C’est aussi toute la question du voyeur et du voyeurisme. A partir de quelle distance est-on voyeur ? Et c’est aussi toute la question de la "facilité à" être voyeur. Celui qui prend une photo caché dans un buisson prend un risque. Où est le risque si plus personne n’est autorisé ? Et que devient le sujet si la technologie permet de à la place de l’autorité régulatrice ? (avis perso)
Pour rappel, les big data c’est la règle des 3V : vitesse, volume, variété.
C’est aujourd’hui un buzz word qui étiquette l’industrie du datamining dont google est l’un des initiateurs. Cette vision purement industrielle (et certainement libérale), à visée totalisante est à relativiser et à mettre en perspective avec le débat citoyen sur l’open data qui est au coeur de la réflexion que conduit l’auteure.
Les pistes qu’elle explore pour permettre aux besoins d’innovation et de protection des données personnelles de vivre en bonne intelligence sont principalement juridiques et politiques dans une perspective de "faire société". Il s’agit pour elle de considérer l’état actuel des usages numériques aujourd’hui et de faire le point sur l’encadrement juridique permettant ou non protection des données personnelles et création de valeur servicielle.
Elle commence par pointer trois pistes qui sont des impasses :
- le statut quo actuel, qu’elle qualifie de « faible régime » : "nous sommes dans une zone d’incertitude juridique, qui encourage les logiques de « prédation » de la donnée par les plates-formes pour les monétiser, avec des approches plus ou moins délicates (opt in / opt out)." L’alternative qui en résulte voit une course juridique sans fin où innovation et protection s’affrontent.
- "La seconde impasse consisterait à vouloir glisser vers un régime de propriété (intellectuelle et/ ou commerciale) des données par l’utilisateur". C’est la logique actuelle du droit d’auteur et de la propriété privé qui prend alors le pas sur le bien public. Chacun est propriétaire de ses données et les monétise comme il l’entend. L’auteure liste alors les conséquences d’une telle option (que je reprends et interprète), responsabilité reportée sur l’individu contre les organisations (logique libérale que l’on retrouve à tous les étages aujourd’hui), la prime donnée aux citoyens éduqués numériquement et donc une fracture d’usage sur la protection des données personnelles, l’éclosion d’acteurs se posant en garant des données personnelles mais appartenant à la sphère marchande, sans contrôle d’une autorité publique, et donc en position de force face à de purs consommateurs (éviction du citoyen), l’irruption de grossistes de données (brocker), une remise en question du régime juridique de la donnée qui n’est pas couvert aujourd’hui par le droit d’auteur, et in fine la création de société de gestion collective des droits à l’image de celles qui gèrent les droits d’auteur aujourd’hui.
A mon avis se pose ici la question de la définition de ce qu’est une donnée.
Pour moi une donnée est un construit, résultat d’une mise en critère d’une fraction du réel inscrit dans un territoire de savoir et pouvant faire l’objet d’un traitement algorithmique afin de produire de nouvelles connaissances.
- Une troisième mauvaise solution consiste à avoir recours à la cryptographie. Pour l’auteure, le problème n’est pas technique mais socio-technique. La course technologique entre l’attaquant et le défenseur est sans fin et épuisante en terme de ressources. Il convient donc de solutionner le problème à un niveau supérieur. Il ne faut pas oublier aussi que, techniquement, l’entrée et la sortie du message, au niveau des tuyaux ne sont pas protégées par le tunneling et que ce dernier n’offre pas de garanties absolues. Pour mémoire c’est le http<strong>S</strong> sur le web qui permet notamment de faire des transactions bancaires.
Après ce premier état des lieux des réponses négatives aujourd’hui envisagées à la problématique du besoin d’innovation versus le besoin de ré-appropriaion de ses données personnelles, l’auteure en vient à considérer 4 pistes d’évolution positives pouvant être déployées seules ou associées.
- "La première piste consiste à orienter l’économie numérique le plus loin possible de l’économie de l’attention pour revenir à une économie servicielle." Il s’agit alors de sortir du modèle actuel - données personnelles contre "gratuité" de l’usage : le modèle publicitaire- Il faut donc sortir de l’illusion du gratuit et revenir à une économie de facturation du service. Il faut également encadrer le marché des données personnelles qui est aujourd’hui opaque et non régulé par la puissance publique. Cela reviendrait alors à documenter le chemin des données enregistrée et à rendre cette documentation publique (toute la qustion des métadonnées).A mon sens il s’agit alors de rendre visible le contexte de construcion de la donnée du producteur au brocker et du brocker à la fabrication de valeur par l’usager ou les services.
- "La seconde piste est certes technique, mais à l’opposé de la cryptographie, va chercher du côté des infrastructures ouvertes et libres (au sens logiciel du terme)." Là où la cryptologie agit, imparfaitement sur le message seul, l’ouverture des dispositifs techniques permettrait aussi d’en comprendre la logique et de pouvoir y intégrer des bouts de code afin d’avoir la main sur ce que ces dispositifs permettent. C’est la logique du libre qui postule que le code est un langage et donc un bien commun non enfermable dans un brevet. Agir ainsi c’est agir sur le cadre de la communication et non sur le message. Travailler sur le cadre de la communication, c’est mettre au premier plan cette économie comme une économie de la communication et faire de la communication un objet industriel.
- "La troisième piste, qui déborde le cadre stricte des données personnelles pour s’intéresser aux données numériques en général, consiste, en s’inspirant des travaux d’Elinor Ostrom et de l’école de Bloomington autour des biens communs, à développer une sphère de données en Communs..." Il s’agit alors de délimiter les droits et les devoirs de chacun au niveau micro des fonctionnalités et des usages et non plus au seul niveau macro des services ? Les données entreraient dans une gestion collective communautaire non publique (Etat) et non privé (marchande). Ce que l’auteure appellent le bundle of right - Le faisceau de droits permettant le partage des données en co-responsabilité ce qui nous permet d’envisager l’usage comme une négociation permanente entre partenaires se reconnaissant comme tel. Trois types de données peuvent entrer dans ce champs selon leur lieu de production : les données de la puissance publique en open data "share alike", les données personnelles placées en bien commun par les individus, les données des entreprises mis en commun dans une logique "systémique" et non, comme cela apparait parfois, dans une logique de captation de l’attention.
- "La quatrième piste, proche dans sa source d’inspiration de la précédente, consiste à imaginer une gestion des données personnelles par un régime de « bundle of rights »." Nous sommes là dans une logique purement juridique où les relations et les interactions entre partenaires autour des objets de relation (les ressources) sont codifiées. La ressource n’apparait plus comme appartenant à mais comme faisant l’objet d’usages divers à qualifier. Il s’agit alors de définir juridiquement le cadre de l’échange et non plus seulement la ressource. Et ce cadre ne peut être défini qu’en envisageant les multiples points de vue des acteurs qui interagissent. Il s’agit alors de définir le cadre entre trois types d’acteurs : moi, l’autre et la plateforme. Des usages seraient garantis à chaque acteurs selon leur besoins et la valeur d’usage construite autour de cette interaction serait encadrée par deux types de droit : autorisation explicite de l’usage par l’individu (opt in ?) et partage limité dans le temps de données agrégées et anonymisées. Il s’agit pour l’individu de se réapproprier le temps et l’espace de la donnée. Personnellement il me semble que les enjeux sont effectivement là, et concerne à la fois la perception nouvelle du temps et de l’espace (qui ne sont pas abolis loin de là) en même temps que l’obligation faite de considérer que ces deux entités ne sont pas appropriables.
Je pense que, en lien avec l’ancienneté du concept de commun, on pourrait aussi se réapproprier le terme de coutume comme le droit ancestral, non écrit auquel chacun se réfère dans une logique communautaire, en période pré-Etat. Nous devons alors peut être envisagé le moment que nous vivons comme un état transitoire entre un non-droit (ou plutôt le droit américain seul) et un Etat-Nation qui garanti le droit sur un territoire donné. Lequel territoire serait alors à envisager à l’échelle planétaire. La coutume fut ce droit non-écrit applicable à une échelle restreinte.
L’auteure parle alors d’un projet de loi, d’avant guerre (39-45) proposé par Jean Zay. Il concevait ledroit d’auteur ...[comme] non pas ... un régime de propriété intellectuelle mais sur la reconnaissance du travail accompli".
Je livre in extenso la conclusion de l’auteure qui sonne comme un manifeste :
Refus de la propriétarisation de la donnée, déplacement du capitalisme informationnel vers une économie servicielle, montée en puissance des infrastructures ouvertes de recueil et traitement des données personnelles, développement d’une sphère des données en régime de Communs, construction d’un droit des données personnelles appuyé sur un « faisceau de droits d’usage »... Chacune de ces pistes vise à empêcher la construction d’une société de surveillance. Certaines sont déjà en cours d’exploration. A nous de multiplier les recherches et de faire se rencontrer les acteurs qui œuvrent à une sortie par le haut de la société des données de masse. Pour que données puisse rimer avec libertés.