AB MEMORIAE : Faites de l’histoire et de la mémoire de votre entreprise une valeur ajoutée.

Nom de l’auteur/autrice :Olivier Le Brun

ab memoriae écrivains
Non classé

Comment archiver des documents numériques ? (partie 2)

Les archives digitales se caractérisent par un « format de lecture ». Au quotidien, tout le monde sait ouvrir un document informatique, que ce soit du texte, des tableurs, des fichiers musicaux, graphiques ou autre. Nous ne regardons plus les extensions en .doc ou .docx ou .pdf et autre .mp3 ou .pjg. Ou plutôt, si, nous les considérons lorsque les fichiers ne s’ouvrent pas facilement, qu’on ne parvient pas à les lire ou les exploiter. Ces formats de lecture vivent et meurent plus ou moins rapidement. Les concepteurs d’outils numériques rivalisent de créativité pour imposer, ou tenter d’imposer de nouveaux formats de lecture, soit pour devenir leader du marché soit pour protéger leurs production. Pour les archivistes cela conduit à une double réflexion : comment garder un document numérique original, donc sans modifier son format de lecture initial, et en même temps, comment s’assurer que ce document numérique peut être lu avec les outils actuels. Dit autrement, comment s’assurer que nos pdf, docx, mp3 et autres jpeg (pour ne prendre que certains formats extrêmement connus de nos jours) seront lisibles dans trois cents ans ? Interrogé, le Directeur des Systèmes Informatiques de la BnF expose la façon dont ils ont réglé ce problème. En une phrase : ils font des copies. Le document original est archivé dans son format numérique original. Et parallèlement, il est fait une copie dans un format de fichier lisible aujourd’hui. Cela implique un travail titanesque et volumineux : régulièrement, il faut s’assurer que la copie est toujours dans un format lisible aujourd’hui et, si nécessaire, en faire une nouvelle copie dans un nouveau format plus contemporain. Tout en reliant cette copie à son original numérique. La BnF a développé cette expertise et propose même ses services comme « prestataire » auprès d’entreprises ou de collectivités qui souhaitent effectuer ce type d’opérations. Pour ce qui est des logiciels, qui servent à lire ou effectuer des opérations, la BnF a développé une stratégie dite « d’émulation » : ils virtualisent les logiciels les éléments matériels par leur équivalent numérique sous forme de programmes ou de fichiers informatiques. Pour ceux que ce sujet intéresse, notez que le système mis en place par la BnF s’appelle SPAR (pour Système de Préservation et d’Archivage Réparti),  et est conçu selon les principes de la norme OAIS (Open Archival Information System, ISO 14721) (article lié : https://abmemoriae.fr/archives-numeriques-petaoctet/)

ab memoriae écrivains
Non classé

Comment archiver des documents numériques ? (partie 1)

Si vous posez la question à un archiviste « Est-il plus facile d’archiver des documents ‘papier’ ou des documents ‘numériques’ », il vous répondra sans hésiter « les papiers ». En effet, pour les documents et archives en format papier, les techniques sont connues, éprouvées, certifiées depuis longtemps ; on connait les dangers qui menacent ce format « matière » – l’eau, le feu, les rongeurs et les vers, le soleil, les manipulations intempestives, etc. et l’on sait les traiter convenablement. Ouvrez un livre qui a 300 ans, une carte qui a 800 ans, l’archiviste sait comment la manipuler pour que vous puissiez lire ce document sans l’abimer. Il n’en est pas de même pour les archives numériques (ou « digitales » mais c’est un anglicisme). Les plus vieilles archives numériques ont l’âge des premiers ordinateurs, c’est-à-dire moins de quatre-vingt ans. On date en effet l’apparition de l’informatique moderne avec la création d’ENIAC, le premier calculateur entièrement électronique. L’apparition de documents rédigés dont la conservation et l’archivage pour de longues durées est nécessaire est encore plus récent, une cinquantaine d’années. Et l’arrivée massive d’archives dans les entreprises, les collectivités puis chez les particuliers date elle du milieu des années 90 avec l’essor des « Personnal Computeurs », nos fameux PC. Depuis l’inflation est vertigineuse en volume produit – et donc à archiver. Ce n’est pas le volume d’archives qui inquiète le plus. Quoique la Bibliothèque Nationale de France, la BnF évoque 10 Petaoctets de données à répertorier à ce jour (2024). Arrêtons nous un instant ici sur ces échelles d’octets encore peu utilisés, et rapportons le aux disquettes que les « Gen Z » ne connaissent même pas. La disquette  5 pouces ¼, dit Floppy disc 5’¼ pouvait stocker 160 ko puis 320 ko pour la seconde génération. C’est la fin des années 80. Suit la disquette dure 3’½ qui contient 720 Ko, la reine des années 90. Puis le Zip arrive, qui contient plusieurs disquettes, puis le CD-ROM qui en contient des dizaines : 780 Mo ! Un grand bon en avant, ce CD-ROM. Lequel a fini détrôné par l’arrivée des Disques durs externes dans les années 2000, pour lesquels on s’est mis à compter en Giga octets (Go) puis en Terra octets (To). A chaque fois qu’on change de nom, on multiplie par mille la capacité de stockage.  Un Petaoctet, c’est 10 puissance 15 octets, c’est un million de Giga. Le volume des documents à archiver augmente très vite, mais cela croit au même rythme que la technique : les capacités de stockages augmentent extrêmement vite elles aussi. Ce qui était très volumineux en 1990 ne se voit quasiment plus aujourd’hui, en terme de volume stocké. Le vrai problème est ailleurs : il est dans le format d’exploitation, de lecture du document informatique. D’autant plus que c’est une science neuve, et les formats de fichiers informatiques évoluent très vite. Qui peut certifier qu’un fichier Word / Excel / Google Sheet, mp », mp4, voire même un simple pdf seront des formats faciles à lire dans dix ou vingt ans ? Alors qu’and l’archiviste réfléchit en terme de générations humaines successives, la réponse est encore plus improbable. La BnF a trouvé une solution : article suivant.

Retour en haut