ADN, ultime disque dur

L'ADN peut stocker toutes les données du monde...

Un article en ligne sur " Le Monde " de ce 28 février 2017 m'incite à mettre à jour ce que j'écrivais à propos de l'archivage de données via des séquences d'ADN (voir ci-dessous).

 

"Le Monde " cite Victor Zhirnov, le directeur scientifique de Semiconductor Research Corporation :

 

 "En l’an mille, le savoir représentait de l’ordre de 100 000 bits d’information par personne, et aujourd’hui, nous en sommes à environ 10 000 milliards de bits par humain. Nous allons rapidement avoir un problème de stockage ! »

 

Tout compris, des images astronomiques, aux articles de revues scientifiques, en passant par les vidéos YouTube, l'archive numérique mondiale représentera environ 44 milliards de gigaoctets (Go) d'ici 2020, soit dix fois plus qu'en 2013 ! 

 

Certes, une puce de silicium peut aujourd'hui stocker toute l'histoire de l'humanité, alors que le premier disque dur d'IBM (1956) avait une capacité de 5 Mo... et nous ne sommes pas prêt de manquer de sable ! Cependant, comme le montre le tableau ci-dessus, nos disques durs présentent deux gros défauts : une durée de vie très limitée (environ 10 ans) et une consommation énergétique considérable.

 

Aujourd'hui la solution la plus avancée pour remplacer le silicium est au coeur même du vivant, il s'agit de l'ADN, support de l'information génétique héréditaire. Un système de codage à 4 bases - A, T, G, C -, qui assure le stockage, l'expression et la transmission de l'information génétique. Très peu énergivore, très stable, l'ADN est donc un candidat très sérieux à la succession.

 

Pour l'utiliser comme support de stockage, les chercheurs utilisent de l'ADN synthétique où sont encodées les données numériques sous forme de bases azotées. Ces données peuvent ensuite être décodées par un ordinateur.

 

Aujourd'hui des entreprises comme Twist Bioscience fournissent à la demande de longues séquences d'ADN. Récemment, Microsoft s'est porté acquéreur de dix millions d'oligonucleotides à longues chaînes pour l'encodage de données numériques.

 

Le potentiel de la méthode est énorme : théoriquement, un millimètre cube suffit à stocker 1 milliard de Go de données. Par conséquent, 16 centimètres cubes suffiraient à stocker toutes les données numériques mondiales.

 

Cependant si les difficultés techniques se résolvent les unes après les autres ; reste un problème de coût. Les chercheurs concernés font cependant remarquer qu'en 2003, après 10 ans de travaux, le génome humain avait été entièrement séquencé pour 3 milliards de dollars, alors qu'aujourd’hui cette opération ne coûterait plus que.... 1000 dollars !

2012 - Une puce à ADN stockant 5,5 millions de gigabits par millimètre cube !

Un bioingénieur et un généticien - George Church et Sri Kosuriv- du Harvard Wyss Institute ont réussi à enregistré 5,5 petabits de données - environ 700 téraoctets - dans un seul gramme de l'ADN, pulvérisant tous les records en la matière.

 Ils ont pour cela choisi deux des quatre nucléotides pour coder le zéro, et les deux autres, pour le 1. Pour lire les données, ils ont utilisé les machines de séquençage automatique du génome.

 

Avec cette méthode, ils ont réussi à encoder sur ADN un livre de 300 pages, illustrations comprises

 

J'ai déjà parlé ICI des travaux pionniers du Craig Venter Institute. George Church et ses collègues ont codé mille fois plus d’informations que l’équipe de Rockville, en utilisant des fragments d’ADN synthétiques.

 

Pour l'avenir, on peut prévoir un monde où le stockage biologique nous permettrait d'enregistrer sans réserve... tout et n'importe quoi !

 

Et n'en doutons pas, les chercheurs auront alors mis au point les techniques  permettant d' exploiter toutes ces données.

 

Voir : Next-Generation Digital Information Storage in DNA, George M. Church, Yuan Gao, Sriram Kosuri , Science

 

Voir : Synthetic Biology Book Written In DNA  

 

Voir sur le site à propos d'utilisations possibles d'ADN ICI

 

 Toute la presse scientifique a aussi évoqué cet article du journal Nature :Towards practical, high-capacity, low-maintenance information storage in synthesized DNA de l'équipe anglaise de Nick Goldman, qui a réussi à encoder dans de l'ADN synthétique un ensemble de 154 sonnets de Shakespeare, un enregistrement (MP3) du célèbre discours de Martin Luther King (« I have a dream ») et quelques autres bricoles.

 

Cette méthode repose sur la conversion du 0 et du 1 d’une séquence numérique en un équivalent sous forme de bases, selon un codage qui fait correspondre à chaque série de huit bits un « mot » formé de cinq lettres qui sont A, C, G ou T (les 4 bases azotées : Adénine, Cytosine, Guanine et Thymine).

 

 

Il y a cependant un problème : l'ADN se conserve en milieu aqueux et porte des charges… Incompatible avec une utilisation à l’interface de la nanoélectronique !

 

Des chimistes spécialistes des polymères, cherchent à utiliser leurs macromolécules, avec pour objectif le stockage des quelques zettaoctets (10 puissance 21) d’information numérique produits chaque année.

Il suffit pour cela d'affecter le 0 ou le 1 à chaque monomère... mais il y a un hic, c'est que la polymérisation a tendance à se faire de façon aléatoire !

 

Des chercheurs français de l'Institut Charles Sadron à Strasbourg sont sur la piste, ils préparent même des supports réinscriptibles, avec des polymères thermosensibles.


Rendez-vous dans une ou deux dizaines d'années !