Datenspeicherung Das Wissen der Welt passt in eine Dose

Marburg · Digitale Informationen lassen sich langzeitstabil und äußerst kompakt mit der Erbsubstanz DNA speichern.

 Ein deutsches  Wissenschaftlerteam will das Molekül der Erbinformation, die DNA, künftig auch als Datenspeicher  nutzen.

Ein deutsches Wissenschaftlerteam will das Molekül der Erbinformation, die DNA, künftig auch als Datenspeicher nutzen.

Foto: Angelika Warmuth/dpa/Angelika Warmuth

In einer Hinsicht werden digitale Datenträger immer besser: Sie werden immer effizienter. Doch sind die Daten dort auch wirklich sicher für lange Zeit archiviert? Daran gibt es Zweifel. Computerwissenschaftler und Biologen wollen nun im Forschungsprojekt „Molekulare Speicher zur Langzeitarchivierung“ (Mosla) einen universellen und wirklich langzeitstabilen Datenspeicher der Natur nutzen, um diesem Anspuch gerecht zu werden. Wir kennen ihn alle. Es ist unsere Erbsubstanz, die DNA.

Analog zur Bitfolge aus Nullen und Einsen der digitalen Welt sind dort auf einem Molekül von zwei Metern Länge die Erbinformationen in einem genetischen Code aneinandergereiht. Die Biologen verwenden die Abkürzungen A, C, G, T, sie stehen für die Moleküle Adenin, Cytosin, Guanin und Thymin. Diese Information sind über Generationen hinweg stabil gespeichert. Außer den Daten gibt es molekulare Prozesse zum Speichern und Schreiben, zum Vervielfältigen und Kopieren, zum Auslesen und sogar zur Fehlerkorrektur.

Die Biologin Anke Becker und der Mathematiker Dominik Heider von der Uni Marburg wollen neue, wirkliche langzeitstabile Datenspeicher entwickeln und dafür DNA nutzen. Denn die ist über lange Zeit relativ stabil, die Technik der Datenarchive unseres Zeitalters veraltet dagegen in wenigen Jahrzehnten oder Daten werden schlicht unlesbar. Wie lange hält eine CD? Wenige Jahre. Was ist mit auf Magnetbändern gespeicherten Daten? Sie verflüchtigen sich. Lesegeräte? Werden rar. „Die Originalaufnahmen vom ersten Menschen auf dem Mond, das war 1969, die gibt es nicht mehr“, erklärt der Mathematiker und Bioinformatiker Heider. Die Menschheit hat vom ersten Schritt auf dem Erdtrabanten nur Kopien.

„Die molekularen Speicher sind lange haltbar und haben eine hohe Kapazität“, erklärt Anke Becker und hält einen kleinen Plastikkolben mit gefriergetrockneten Bakterienzellen hoch. Heider hält eine Standard-Festplatte dagegen. „Rund ein Terabyte sind ja heute geläufig.“ In Biomaterial sei hingegen pro Gramm Substanz die millionenfache Kapazität denkbar. Im Projekt Mosla wollen sich die Forscher dieser Speichertechnik annehmen, von der Synthese der DNA-Stränge, über Mechanismen des Kopierens und der Lagerung bis zur Wiederherstellung und dem Auslesen.

Vor Kurzem haben US-Forscher um Yaniv Ehrlich von der Columbia-Universität in New York in einem Versuch die Machbarkeit dieses Verfahrens demonstriert. Sie codierten einen Datensatz von 2,5 Megabyte in die Erbsubstanz DNA. Enthalten waren ein kleines Betriebssystem, ein Film, die Geschenkkarte eines Online-Shops und verschiedene weitere Dateien. Diese Informationen lagen nach der Synthese in rund 72 000 kurzen DNA-Schnipseln vor. Anschließend dekodierten sie die biologische Information, zeigten den wiederhergestellten Videofilm und ließen das Betriebssystem laufen. Für die gesamte Prozedur des DNA-Schreibens und -Lesens benötigten sie einige Stunden, bei Kosten von mehreren tausend Dollar. Doch hier werde es in den kommenden Jahren sicherlich Fortschritte geben, sind sich Anke Becker und Dominik Heider sicher. Heider hebt sein iPhone hoch. Daran sei vor 15 Jahren auch nicht zu denken gewesen.

Dass die molekularen Speicher den USB-Stick ersetzen, glaubt Heider nicht. Denn dessen Geschwindigkeit dürften die DNA-Speicher nicht erreichen. Anke Becker: „Es geht ums Archivieren der Daten.“ Heider stellt sich eine Speicher-Hierarchie wie eine Pyramide vor. Ganz oben und am schnellsten wären die ultraschnellen, sogenannten Cache-Speicher eines Computers, unten an der Basis dann die molekularen Speicher für die Langzeitarchivierung. „Wir haben uns einen stabilen Speicherzeitraum von bis zu 100 000 Jahren vorgestellt“, sagt Heider. Ohne diese substanzielle Archivierung drohe der Gesellschaft das sogenannte „Digital Dark Age“. Der Fachausdruck steht für den Verlust von Informationen, weil es keine Technik mehr gibt, um sie zu lesen. Ende des Jahrzehnts soll der Datenberg um zwei Milliarden Terabytes pro Jahr anwachsen – also zwei Milliarden aktueller Standardfestplatten.

Heider arbeitet aktuell daran, digitale Information – die in den zwei Zuständen „0“ und „1“ kodiert sind – auf eine Viererkodierung der vier DNA-Basen A, C, G und T umzurechnen. Auch neue Fehlerkorrekturverfahren will er entwickeln. „Fehlerhafte Datensätze lassen sich so wieder herstellen“, sagt der Bioinformatiker.

Spezielles Augenmerk liegt auf der materiellen Form der Langzeitspeicherung. Der Biochemiker Peter Graumann hat dafür Sporen in den Blick genommen. Wenn Bakterien hungern, können sie sich in kompakte, langlebige Sporen verwandeln, um diese Durststrecke zu überstehen. Ein Tröpfchen Wasser und Nährstoffe genügen dann, um sie wieder aufzuwecken. Der Vorteil für Anke Becker liegt darin, dass die Sporen dabei die zelleigenen Korrekturmechanismen anwerfen. Die Zellen reparieren ihre DNA selbst. Noch klingen die Pläne wie Zukunftsmusik. Heider kann sich erste Anwendungen bei Archiven und Rechenzentren vorstellen. „Ob das auch mal den Heimanwender erreicht, ist offen“, sagt der Informatiker. In Deutschland gibt es nach Angaben der Marburger Forscher keine Forschungskonkurrenz. Neben der Konzernforschung von Microsoft arbeiten allerdings auch US-amerikanische Gruppen an einem Speicherkonzept mittels DNA.

Meistgelesen
Neueste Artikel
Zum Thema
Aus dem Ressort