Stocker les données dans de l’ADN pour Archives on Tour
En compagnie des apprentis de troisième année en Information documentaire de l’Ecole professionnelle de Lausanne, auxquels Alp’info enseigne l’archivistique, nous avons découvert les recherches et tests en cours sur le stockage à long terme des données dans l’ADN. C’était le 11 mars dernier, aux Archives cantonales vaudoises, lors du passage de la boîte archives qui fait le tour des cantons, à l’occasion du centenaire de l’Association des archives suisses.
Garder longtemps, oui mais sur quel support ?
Un des enjeux de la pratique archivistique est le choix d’un support de stockage pérenne. Dans un certain nombre de cas, grâce aux bonnes pratiques de gouvernance de l’information, il est possible d’orienter le choix du support de conservation dès la création de l’archive. Mais lorsqu’il s’agit d’archives numériques que l’on veut préserver pour l’éternité, l’archiviste se doit d’être pragmatique et mise sur la survie de l’information avec la création d’une copie de conservation qui sera migrée ou convertie au gré des évolutions technologiques. Or cette copie de conservation numérique possède une empreinte environnementale énorme par rapport à un support papier, du fait des coûts de stockage (conditions atmosphériques et nécessité de redondance).
Dans ce cadre, l’enregistrement sur un support biologique comme l’ADN est une piste à explorer. C’est en tous cas ce qu’ont testé à l’automne dernier les Archives de France avec l’enregistrement de la déclaration des droits de l’homme… ou les Archives cantonales du Canton de Vaud, à l’occasion d’Archives on Tour. Mais pourquoi l’ADN est-il intéressant ?
L’ADN de vos données au sens propre comme au figuré ?
Comme tout programme informatique, l’ADN se réplique très facilement et contient des tables de contrôle pour directement corriger les éventuelles erreurs de copie. Si l’encodage est mis à disposition du public, comme pour les logiciels libres, chacun est à même de coder et décoder le contenu. Si le fragment est seché, comme pour les fruits qu’on passe au déshydrateur, il est très stable avec une durée de vie estimée à 1000 ans, dans l’état des connaissances actuelles. Il suffit ensuite d’humidifier le brin d’ADN pour le ramener à la vie. Dernier aspect, un gramme d’ADN peut contenir jusqu’à 215 pétabytes de données, soit l’équivalent des Archives de la Suisse, selon les estimations de Jan Krause qui présentait le projet le 11 mars. En revanche chaque lecture de brin passe par sa destruction : on ne peut le lire qu’une fois. Mais lorsque la copie ne coûte rien et ne prend qu’une place infime, cet inconvénient n’en est plus un.
Pour ces tests d’ADN, les Français ont travaillé sur un échantillon in-vivo, tandis que les Helvètes ont préféré un échantillon sec plaqué entre deux couches de carbone et de silicate. Qu’ont-ils encodé ? La liste des institutions vaudoises d’Archives avec quelques informations de présentation. La pipette contenant le résultat a maintenant été insérée dans la boîte d’archives avec toute la documentation et l’on se réjouit de voir qui va travailler au décodage des données.
Pour en savoir plus
Voir le travail de Bachelor 2021 de Dina Andriamahady qui a réfléchi à la conformité OAIS d’un système de préservation électronique à long terme qui se fonderait sur l’ADN.
Pour l’expérience des Archives de France, le dossier de presse contient un fascicule de vulgarisation très clair.
Le blogue des étudiants en archivistique à l’École de bibliothéconomie et des sciences de l’information (EBSI) de l’Université de Montréal fournit aussi un éclairage sur les enjeux de conservation à travers deux billets publiés en 2017.
En 2020, un point est fait sur les pratiques dans, Meiser, Linda C., Philipp L. Antkowiak, Julian Koch, Weida D. Chen, A. Xavier Kohll, Wendelin J. Stark, Reinhard Heckel, et Robert N. Grass. « Reading and Writing Digital Data in DNA ». Nature Protocols 15, nᵒ 1 (janvier 2020): 86‑101.
Sur l’outil d’encodage utilisé Archive on Tour, voir la documentation de Jan Krause sur Github.