Une conversation entre Françoise Banat-Berger, directrice des Archives nationales, Agnès Violeau, commissaire d’exposition et Daphné Le Sergent, artiste, dans le cadre de son projet « Géopolitique de l’oubli ».
Agnès Violeau : Nous sommes avec Daphné le Sergent, reçues aux Archives Nationales par sa directrice, Madame Françoise Banat-Berger. Vous avez la gentillesse de nous accueillir dans le cadre de l’exposition « Géopolitique de l’oubli », présentée par Daphné Le Sergent au Jeu de Paume à Paris, ainsi qu’au CAPC à Bordeaux, et au Musée Amparo à Puebla, au Mexique. Il s’agit du deuxième volet de la programmation satellite 11 que j’ai construite, intitulée « Novlangue_ ». Comment avez-vous accueilli le projet de Daphné Le Sergent, qui est venue travailler avec vos équipes, d’abord pour ses recherches, puis pour le tournage de sa vidéo ?
Françoise Banat-Berger : La première rencontre avec Daphné Le Sergent a eu lieu dans le cadre d’un partenariat portant sur des programmes autour du numérique et de l’art. Quelque temps après, nous l’avons revue, quand elle travaillait sur le projet Géopolitique de l’oubli. Elle était de ce fait très intéressée par tout le travail concernant les données nativement numériques. On commence à en recevoir beaucoup depuis un certain nombre d’années, avec à la fois des problématiques liées à l’image, aux masses de données, au sens donné à ces données, à la question de leur pérennisation et à leur repérage. C’est à la suite de cette deuxième rencontre qu’ont eu lieu des discussions beaucoup plus poussées, notamment avec notre département chargé de l’archivage électronique et des archives audiovisuelles, ainsi qu’une visite sur le site de Fontainebleau.
Daphné Le Sergent : On a souvent tendance, au vu de la renommée du site historique des Archives Nationales dans le Marais, à penser que les archives contiennent majoritairement des documents papier, ou du moins concrets. Pourriez-vous plutôt nous parler de cet aspect numérique de l’archivage des données ?
FBB : Les Archives Nationales se sont adaptées, et ce depuis toujours, à l’évolution des supports et à la trace des écrits, puisque les premiers documents que l’on conserve sont des papyrus qui datent du VIIe siècle ap. J.-C. Ensuite les parchemins se sont progressivement imposés, puis le papier, dont la qualité varie en fonction des modes de fabrication dans le temps. Mais il y a également des photographies, des calques, des plans… Apparaissent ensuite les premières archives sonores, audiovisuelles, et enfin, les archives nativement numériques. On a commencé à recevoir ces archives numériques au début des années 1980. Une méthodologie nouvelle a dû être mise en place pour les appréhender. À l’époque, il s’agissait surtout de prendre en charge des extractions de données provenant de grandes bases statistiques, dans tous les domaines d’activité. Pour vous donner une idée, aujourd’hui on doit à peu près conserver 50 Téraoctets de données nativement numériques, ce qui correspond à environ à 150 millions de fichiers. Pendant toute une première période, donc, comme je viens de le mentionner, nous avons collecté de nombreux fichiers provenant de l’INSEE, de l’INED, portant sur des enquêtes statistiques, puis à cela se sont ajoutés de plus en plus de documents audiovisuels ou de photographies nativement numériques, ainsi que des documents issus de la production bureautique, avec un nombre très élevé de fichiers mais une volumétrie bien moindre que celle des documents image et surtout audiovisuels. Aujourd’hui enfin, ce sont beaucoup de messageries que nous recevons. Actuellement, on commence à voir un renversement entre la production papier et la production numérique, c’est-à-dire que l’on observe, par exemple dans le versement des archives des cabinets ministériels lors des changements de Gouvernement, la part papier baisser de manière assez significative, quand la part numérique commence à augmenter sensiblement.
DLS : Pensez-vous qu’un jour, il n’y aura plus de papier du tout ?
FBB : Je ne peux pas me prononcer sur l’avenir, mais ce que je constate c’est que les papiers ont été longtemps conservés tels des preuves, avec une continuité dans les marques d’authentification, et des signature manuscrites. Par exemple, encore aujourd’hui pour la production de lois, malgré la dématérialisation du processus, les originaux sont toujours sous forme papier. Mais c’est un mouvement qui tend peu à peu à disparaître.
DLS : J’imagine qu’il y a désormais des processus d’identification numérique faisant tout autant preuve que les documents papier.
FBB : L’environnement juridique le permet totalement aujourd’hui. Pour autant, cela signifie un complet bouleversement du processus de travail et des modes d’organisation en amont, notamment des circuits de signatures. Dans le cas des archives ministérielles, les ministres continuent à signer des parapheurs sur du papier. Cela n’atteint donc pas tous les niveaux de la chaîne, bien que les outils existent déjà. Ce sont, suivant le contexte, soit des signatures électroniques, soit des systèmes d’empreintes, qui, étant des scellements électroniques, permettent de garantir l’intégrité de l’information.
Le numérique c’est très paradoxal, car il est finalement très difficile de conserver les données numériques correctement dans un temps long, mais il est également très compliqué de les détruire complètement. Aujourd’hui par exemple, au nom de la protection des données à caractère personnel, des données enregistrées dans des systèmes d’information doivent être détruites. Or, il est très compliqué techniquement d’arriver à les effacer totalement. On se contente alors très souvent de supprimer le lien logique entre l’information et son inscription sur un support. Mais ce n’est pas forcément un effacement physique sur le support qui est effectué. Nous n’avons donc pas une maîtrise absolue sur l’information numérique.
AV : Cela veut dire que l’information qui est sauvegardée sous forme numérique et immatérielle, est plus pérenne que celle sauvegardée de manière matérielle ?
FBB : Comme je le disais, cette information est compliquée à détruire, mais également délicate à bien conserver dans toute son intelligibilité. Cette information est encodée dans un format donnée, elle est gravée et inscrite sur un support dans le contexte technologique de l’époque. Le problème c’est que ce support n’est lui-même pas pérenne. L’enjeu est donc de parvenir à conserver ce contenu d’information de manière à pouvoir le retrouver plus tard, lorsqu’on en aura besoin, donc, dans un environnement technologique du futur qu’on ne peut connaître à l’avance.
DLS : Du coup, la donnée se trouve accompagnée d’une richesse d’informations. Comment avec la perspective du futur et des destinataires éloignés, pense-t-on la hiérarchisation de ces données, et le dispositif grâce auquel une personne, pas forcément familière de notre époque, peut recevoir correctement cette quantité d’informations et la donnée initiale ?
FBB : C’est déjà une question qui se pose pour les archives papier. Nous conservons des archives très anciennes, sous une forme qui n’est intelligible que par des personnes spécialisées. C’est une difficulté qui existe de tout temps, avec des ruptures épistémologiques, dans la langue… Les langues anciennes se sont transformées, les codes ont changé, et sans eux on ne sait pas lire, ni comprendre. Aujourd’hui par exemple, rendre explicite l’ordonnance d’un roi de France, avec les formules de l’époque, demande des connaissances que peu de gens possèdent. Après, tout dépend de la manière dont nous décryptons tout cela et comment toutes ces informations sont décodées et explicitées. On explique tel terme, telle forme, et c’est pour cela que l’on inventorie les archives : pour qu’elles parviennent aux générations futures avec certaines clefs de déchiffrement. Et, le numérique ajoute une couche supplémentaire. C’est la couche technologique, qui fait que tout évolue beaucoup plus vite en terme d’outils. Que ce soit des formats, des systèmes d’exploitation, des supports, ces trois éléments font que lorsque l’on en change un, l’information n’est plus accessible. En revanche la rupture documentaire et cognitive a toujours existé.
AV : Vous parliez de ce rôle de passeur d’un savoir aux générations futures. Il est aujourd’hui lié à des outils numériques qui permettent de conserver ces paysages cognitifs, mais qui changent aussi extrêmement vite. Le rapport au temps n’a-t-il pas changé justement ?
FBB : Le numérique introduit quelque chose de nouveau qui est l’obsolescence technologique rapide. Avant, les sauts technologiques étaient bien plus lents. Il y avait déjà eu d’importantes révolutions, mais avec l’obsolescence technologique qui s’accélère d’une part, et la masse qui augmente d’autre part, c’est d’autant plus délicat. Se posent également de nouvelles questions sur l’appréhension des masses d’informations importantes, qu’il faut caractériser par des modes de description suffisamment explicites et ouverts pour être compréhensibles dans le temps. C’est pour cela qu’aujourd’hui, lorsque l’on fait de la normalisation, on décide que tel type d’information sera décrit de telle manière pour qu’elle le soit partout de la même façon, et ainsi permettre l’interopérabilité entre différents systèmes. La question de la migration des formats est également une question très complexe étant donné le nombre de formats différents qu’on est susceptibles de prendre en charge. Avec la masse, nous retrouvons les enjeux des Big Data, de l’intelligence artificielle. On ne pourra pas faire sans, sinon nous n’aurons jamais la capacité de traiter la masse et les diversités de données, formats et métadonnées que nous rencontrons.
DLS : Vous parlez de masse d’informations. Dans mon projet vidéo, je me suis beaucoup intéressée à la notion de Big Data, de Data Déluge. De la manière dont vous en parlez, j’ai l’impression que l’on pourrait presque, vis-à-vis de cette masse, parler de flux d’informations, de flux de données automatisées, qui seraient possiblement réduits à des canaux, qu’on pourrait rediriger vers tel destinataire ou tel autre. Mais, c’est toute une opération de programmation en informatique. Comment gérer ces masses à un moment où tout est producteur d’informations, et comment gérer cette distribution de flux ? Comment allez-vous archiver ou non, hiérarchiser ou non, parmi ce Big Data de potentielles archives ?
FBB : Nous avons une mission réglementaire, qui porte sur la production des institutions et administrations publiques, chacune dans leur domaine d’activité. On assiste à des transformations dans cette période charnière où l’on passe d’un support papier à des supports numériques. Notre travail consiste donc à établir des cartographies des systèmes d’information existants, visant à sélectionner les jeux de données devant être pris en charge pour une conservation définitive. La prise en charge de données numériques demande plus d’investissements humains et technologiques que celle des archives papier. On va donc concentrer nos efforts sur les informations les plus riches, qu’elles soient patrimoniales ou juridiques. Le jeu en vaut pourtant la chandelle puisque lorsque l’on a fait l’effort de modéliser un flux d’archivage, il peut par la suite se répéter et s’automatiser.
DLS : Vous parlez de réservoir, vous parlez de flux. On a l’impression que l’information est devenue liquide. J’ai aussi entendu parler de Lac de données. Ce champ lexical de la redistribution de l’information me semble intéressant à commenter.
FBB : Effectivement, car l’information numérique n’est jamais stable, immuable, immobile ; elle se transforme tout au long de sa vie. Ces fameux filtres permettent de choisir ce qui doit être conservé en priorité, et donc d’organiser cette dérivation pour passer d’un système à un autre, en tentant de trouver un univers lexical qui s’applique à tous les domaines métier, en créant des ontologies. On essaie de créer un environnement global. La difficulté est là.
DLS : Le vocabulaire que vous utilisez est proche de celui d’Internet, avec la notion de nuage, de Cloud data, de surf, l’eau étant la métaphore qui nous permet de faire le lien avec l’information. Mais comment peut-on rattacher ce lien à notre environnement ? Par exemple le Cloud a une image « gentille » mais cache tout un modèle économique (celui de la Sillicon Valley). L’eau, comme élément essentiel de la vie, deviendrait l’image de notre société numérisée ?
FBB : On peut aussi évoquer le pétrole par rapport aux données. Les données sont en train de devenir une richesse essentielle, et ceux qui les maîtrisent, ont un énorme pouvoir. On voit également que cette information numérique est difficile à maîtriser. Elle peut être déviée, falsifiée, déformée, d’où l’importance de posséder des organismes garants de son intégrité. Aujourd’hui, on détermine au sein de l’Etat quelles sont les organismes responsables de la qualité de tel ou tel type de données.
DLS : Pour reprendre le vocabulaire de l’eau, ne peut-on pas parler de piratage de l’identité afin de faire valoir une information qui n’est pas authentique ?
FBB : Oui, et c’est là qu’existent des outils et des technologies qui nous protègent. Aujourd’hui, l’agence nationale pour la sécurité des systèmes d’information est le service de l’Etat qui embauche le plus en France, car nous savons que c’est un enjeu énorme et une course de vitesse. Il faut toujours conserver une avance par rapport aux hackeurs. Si vous réussissez à mettre en place une clé de chiffrement robuste, tout aussitôt la communauté des hackeurs va travailler pour la craquer, et ainsi de suite. On a donc des technologies, via des outils de scellement ou de cryptage, qui permettent de garantir d’une manière raisonnable qu’une donnée a été produite par telle institution ou tel individu et est restée intègre. C’est une véritable guerre que ces enjeux de sécurité et c’est donc un sujet géopolitique.
AV : Pourrait-on imaginer qu’à un moment donné la machine soit suffisamment intelligente pour décider de ce qui sera archivé ou pas, pour refuser des informations ? Peut-on basculer sous le joug décisionnel d’une machine quant à l’archivage ?
FBB : Pas à l’heure actuelle, car l’intervention humaine est nécessaire dans la prise en charge des archives numériques par les machines. Mais dans le futur, pourquoi pas ? Pour l’instant, les humains apprennent encore aux machines à devenir intelligentes.
AV : Le fait d’archiver un document s’offre à nous du moment que l’on peut le faire. Comment se positionne-t-on face à cette mission qu’est l’archivage de l’histoire ?
FBB : Les services d’archives peuvent être perçus comme des institutions officielles de l’Etat, conservant les sources officielles permettant de documenter les politiques publiques. Mais, les services d’archives conservent également des fonds immenses concernant les histoires individuelles des personnes, traçant tous les moments de la vie où nous avons affaires à l’administration. Or nous sommes dans un pays où l’Etat est fort. Pour accéder à ses droits, il faut être enregistré. Vous pouvez également demander des aides, passer devant la justice… Nous avons des millions de parcours de vie, à travers les dossiers constitués pour instruire telle ou telle demande. Nous collectons également des archives privées infiniment précieuses pour compléter les fonds publics. Ce sont ces liens entre histoire collective et histoires individuelles, entre archives publiques et archives privées, qui font la richesse de nos institutions. Et c’est ensuite à l’historien et au chercheur d’exploiter ces sources tout en sachant bien évidemment repérer les éventuels biais.
Le carnet de Daphné Le Sergent
« Géopolitique de l’oubli » / l’exposition
« Géopolitique de l’oubli » / le livre
Daphné Le Sergent