Les archives digitales se caractérisent par un « format de lecture ». Au quotidien, tout le monde sait ouvrir un document informatique, que ce soit du texte, des tableurs, des fichiers musicaux, graphiques ou autre. Nous ne regardons plus les extensions en .doc ou .docx ou .pdf et autre .mp3 ou .pjg.
Ou plutôt, si, nous les considérons lorsque les fichiers ne s’ouvrent pas facilement, qu’on ne parvient pas à les lire ou les exploiter.
Ces formats de lecture vivent et meurent plus ou moins rapidement. Les concepteurs d’outils numériques rivalisent de créativité pour imposer, ou tenter d’imposer de nouveaux formats de lecture, soit pour devenir leader du marché soit pour protéger leurs production.
Pour les archivistes cela conduit à une double réflexion : comment garder un document numérique original, donc sans modifier son format de lecture initial, et en même temps, comment s’assurer que ce document numérique peut être lu avec les outils actuels.
Dit autrement, comment s’assurer que nos pdf, docx, mp3 et autres jpeg (pour ne prendre que certains formats extrêmement connus de nos jours) seront lisibles dans trois cents ans ?
Interrogé, le Directeur des Systèmes Informatiques de la BnF expose la façon dont ils ont réglé ce problème.
En une phrase : ils font des copies.
Le document original est archivé dans son format numérique original. Et parallèlement, il est fait une copie dans un format de fichier lisible aujourd’hui.
Cela implique un travail titanesque et volumineux : régulièrement, il faut s’assurer que la copie est toujours dans un format lisible aujourd’hui et, si nécessaire, en faire une nouvelle copie dans un nouveau format plus contemporain. Tout en reliant cette copie à son original numérique.
La BnF a développé cette expertise et propose même ses services comme « prestataire » auprès d’entreprises ou de collectivités qui souhaitent effectuer ce type d’opérations.
Pour ce qui est des logiciels, qui servent à lire ou effectuer des opérations, la BnF a développé une stratégie dite « d’émulation » : ils virtualisent les logiciels les éléments matériels par leur équivalent numérique sous forme de programmes ou de fichiers informatiques.
Pour ceux que ce sujet intéresse, notez que le système mis en place par la BnF s’appelle SPAR (pour Système de Préservation et d’Archivage Réparti), et est conçu selon les principes de la norme OAIS (Open Archival Information System, ISO 14721)
(article lié : https://abmemoriae.fr/archives-numeriques-petaoctet/)