Si vous posez la question à un archiviste « Est-il plus facile d’archiver des documents ‘papier’ ou des documents ‘numériques’ », il vous répondra sans hésiter « les papiers ».

En effet, pour les documents et archives en format papier, les techniques sont connues, éprouvées, certifiées depuis longtemps ; on connait les dangers qui menacent ce format « matière » – l’eau, le feu, les rongeurs et les vers, le soleil, les manipulations intempestives, etc. et l’on sait les traiter convenablement.

Ouvrez un livre qui a 300 ans, une carte qui a 800 ans, l’archiviste sait comment la manipuler pour que vous puissiez lire ce document sans l’abimer.

Il n’en est pas de même pour les archives numériques (ou « digitales » mais c’est un anglicisme).

Les plus vieilles archives numériques ont l’âge des premiers ordinateurs, c’est-à-dire moins de quatre-vingt ans. On date en effet l’apparition de l’informatique moderne avec la création d’ENIAC, le premier calculateur entièrement électronique.

L’apparition de documents rédigés dont la conservation et l’archivage pour de longues durées est nécessaire est encore plus récent, une cinquantaine d’années.

Et l’arrivée massive d’archives dans les entreprises, les collectivités puis chez les particuliers date elle du milieu des années 90 avec l’essor des « Personnal Computeurs », nos fameux PC.

Depuis l’inflation est vertigineuse en volume produit – et donc à archiver.

Ce n’est pas le volume d’archives qui inquiète le plus. Quoique la Bibliothèque Nationale de France, la BnF évoque 10 Petaoctets de données à répertorier à ce jour (2024).

Arrêtons nous un instant ici sur ces échelles d’octets encore peu utilisés, et rapportons le aux disquettes que les « Gen Z » ne connaissent même pas.

La disquette  5 pouces ¼, dit Floppy disc 5’¼ pouvait stocker 160 ko puis 320 ko pour la seconde génération. C’est la fin des années 80.

Suit la disquette dure 3’½ qui contient 720 Ko, la reine des années 90.

Puis le Zip arrive, qui contient plusieurs disquettes, puis le CD-ROM qui en contient des dizaines : 780 Mo ! Un grand bon en avant, ce CD-ROM. Lequel a fini détrôné par l’arrivée des Disques durs externes dans les années 2000, pour lesquels on s’est mis à compter en Giga octets (Go) puis en Terra octets (To).

A chaque fois qu’on change de nom, on multiplie par mille la capacité de stockage.  Un Petaoctet, c’est 10 puissance 15 octets, c’est un million de Giga.

Le volume des documents à archiver augmente très vite, mais cela croit au même rythme que la technique : les capacités de stockages augmentent extrêmement vite elles aussi. Ce qui était très volumineux en 1990 ne se voit quasiment plus aujourd’hui, en terme de volume stocké.

Le vrai problème est ailleurs : il est dans le format d’exploitation, de lecture du document informatique. D’autant plus que c’est une science neuve, et les formats de fichiers informatiques évoluent très vite.

Qui peut certifier qu’un fichier Word / Excel / Google Sheet, mp », mp4, voire même un simple pdf seront des formats faciles à lire dans dix ou vingt ans ? Alors qu’and l’archiviste réfléchit en terme de générations humaines successives, la réponse est encore plus improbable.

La BnF a trouvé une solution : article suivant.