Es liegt alles in den Genen: Wie DNA unser Problem mit der Datenspeicherung lösen kann

Daten sind die DNA der modernen Volkswirtschaften. Das kann man ziemlich wörtlich nehmen, sollte sich die Arbeit einer Gruppe von Wissenschaftlern durchsetzen.

Das Informationszeitalter hat unser Leben in jeder Hinsicht von Grund auf verändert.

Aber jede digitale Innovation bringt auch Probleme mit sich. Besonders dringend ist die Frage, wie wir die riesigen Datenmengen speichern sollen, die unsere elektronischen Geräte produzieren.

Laut dem US-Marktforschungs- und Beratungsunternehmen International Data Corporation (IDC) ist der Bedarf an Speicherkapazität zwischen 2009 und 2017 von 400 Milliarden auf 14 800 Milliarden Gigabyte (14 800 Exabyte) gestiegen. Es wird außerdem davon ausgegangen, dass diese Zahl jedes Jahr um ein Drittel wachsen wird.

Mit der existierenden Technologie ist dieser Zustand nicht haltbar. Obwohl die Stückkosten der Datenspeicherung in den letzten Jahren stark gesunken sind, werden so viele Daten generiert, dass die Unterhaltung konventioneller elektronischer Archivierungssysteme, die viel Platz beanspruchen und mit der Zeit zerfallen, immer aufwändiger und teurer wird.

Deshalb beschäftigen sich Wissenschaftler wie Dr. Nick Goldman vom Europäischen Institut für Bioinformatik (EMBL-EBI) in Cambridge (Großbritannien) mit unkonventionellen Lösungen. Wie DNA.

DNA, so erklärt Goldman, ist ein potenziell geniales Medium für die Datenspeicherung, wenn man ihre „Fähigkeit zum Kodieren von Informationen mit hoher Dichte, ihre Langlebigkeit und [ihre] nachgewiesene Erfolgsbilanz als Informationsträger berücksichtigt.“

Sicher ist nicht von der Hand zu weisen, dass der Evolutionsdruck aus Hunderten von Millionen Jahren die DNA zu einem äußerst effizienten Speichermedium für die großen Mengen von Informationen werden ließ, die benötigt werden um die Proteine und anderen Komponenten zu generieren, aus denen komplexe Organismen bestehen.

All diese Informationen sind auf den langen, schraubenförmigen Sequenzen der vier molekularen Einheiten kodiert, aus denen die DNA besteht - auf ganz ähnliche Weise, wie das gesamte Internet und alles Digitale von der CD-ROM bis zu den Fotos auf einem Smartphone durch die Werte 1 und 0 dargestellt wird.

Die Idee von der DNA als Speichermedium hatte Goldman aber nicht sofort. Er war bei der Arbeit im EMBL-EBI, als er bei der Katalogisierung der von Genomforschern aus der ganzen Welt generierten DNA-Daten feststellte, dass ihm mehr genetische Informationen vorlagen, als er speichern konnte.

„Ich arbeite in einem Institut, in dem wir unter anderem alle Informationen über die DNA aller Genome auf Computern speichern müssen, die von Wissenschaftlern auf der ganzen Welt erstellt werden. Und das macht uns ziemliche Schwierigkeiten. Es sind Unmengen von Informationen, die wir jeden Tag erhalten“, so Goldman.

storage gif de
Speicher-Angebot-Nachfrage

Erst nach langem und erheblichen Kopfzerbrechen kamen Goldman und seine Kollegen darauf, dass die Lösung ihres Speicherproblems buchstäblich vor ihrer Nase lag: die DNA selbst.

Sie stellten fest, dass die DNA nicht nur biologische Kodierungen speichern, sondern als Speicherort für beliebige Informationen dienen kann.

Goldman und sein Team packten ordentliche Datenpakete aus 180 Basenpaaren – die DNA hat die Gestalt einer Einheit, die mit einem Gegenstück verbunden ist, wobei die Kette aufgebaut ist, wie eine gedrehte Leiter - so entsteht die Doppelhelix. Von diesen Basenpaaren kodieren etwa 100 die gespeicherten Informationen, 20 werden benötigt, um die Informationen zu indizieren, und die übrigen, um den Prozess zu unterstützen.

„Das Schwierigste ist die erste Kopie“, erklärt Goldman. „Wenn man erstmal eine hat, ist es leicht, weitere herzustellen.“

Kühl-DNA

„Zu Beginn würde die Technologie für Backups von existierenden Daten genutzt werden, die man sicher aufbewahrt wissen möchte“, so Goldman. Das ist wichtig, weil die existierenden Technologien mit der Zeit an Qualität verlieren und schnell veralten.

Magnetische Speicher neigen zum Beispiel zu Leistungsverlusten, außerdem kann der Zugriff auf Daten, die in alten Systemen gespeichert sind, durch den technologischen Fortschritt mit der Zeit immer schwieriger werden. Wer hat heute schon noch einen Computer mit Diskettenlaufwerk? Oder eine Musikanlage, die Achtspur-Tonbänder abspielen kann?

Die DNA hingegen ist so alt wie das Leben auf der Erde. Sie ist außerdem haltbar.

„Sie sollte trocken aufbewahrt werden, denn  Wasser löst die Stränge , und das erreicht man am besten bei Temperaturen unter null Grad“, erklärt Goldman. „Sie vor Licht zu schützen, reduziert außerdem Mutationen durch radioaktive Strahlungen.

Wenn man das berücksichtigt, hält sie sich jahrhundertelang.

Das Alter einiger DNA-Muster aus dem grönländischen Eis wird auf über eine Million Jahre geschätzt - obwohl bislang noch keine Dinosaurier-DNA gefunden wurde.

Aber das ist noch nicht alles. DNA ist so effizient, dass ein einziges Gramm 215 Millionen Gigabyte speichern kann. Das bedeutet, dass alle Daten, die von der Menschheit jemals aufgezeichnet wurden, in einen Raum von der Größe eines normalen Wohnzimmers passen würden.

DNA ist in der Lage, mehr Informationen in einer beliebigen Sequenz zu komprimieren als die konventionelle Rechentechnologie mit dem binären Zahlensystem, denn sie verfügt über vier statt nur zwei verschiedene Einheiten (siehe Grafik am Ende des Artikels).

Eine faszinierende Möglichkeit wäre es, Daten in die DNA lebender Kreaturen zu schreiben, findet Goldman.

In kleinerem Umfang hat es das auch schon gegeben. Der Künstler Eduardo Kac übersetzte einen Satz aus der Schöpfungsgeschichte in DNA und implantierte ihn Bakterien. Andere ließen ihre Initialen als eine Art Markenzeichen in genetisch veränderte Organismen schreiben.

Die Aussicht, eine Festplatte in einem Virus zu haben, ist jedoch (im Gegensatz zum umgekehrten Fall, nämlich einer Festplatte voller Viren) eher unwahrscheinlich. Lebende Kreaturen werden wohl nie zu Speichermedien für große Datenmengen werden. Denn auch wenn die meisten Organismen lange Stränge von „Schrott-DNA“ aufweisen, deren Bestimmung die Wissenschaftler noch nicht herausgefunden haben oder die redundant vorhanden sind - „gibt es Grenzen dafür, wie viel Müll man lebenden Organismen implantieren kann“, sagt Goldman.

Zu viel DNA kann den Organismus belasten. Bei jeder Zellteilung wird die hinzugefügte DNA zusammen mit dem biologisch notwendigen Code repliziert, was viel Energie verbraucht. Zugleich kann es bei jeder Teilung zu Mutationen kommen, die die kodierte DNA schädigen. Nach mehreren Generationen ist das ein bisschen wie „Stille Post“.

Bislang ist die Datenspeicherung auf DNA überwiegend dem Labor vorbehalten.

„Wir hatten zwar schon Anfragen von Unternehmen, die an der Technologie interessiert waren, aber die Kosten haben sie abgeschreckt“, erklärt Goldman.

Obwohl die Kosten für das Lesen und Beschreiben von DNA in den letzten Jahren deutlich gesunken sind, ist es im Vergleich zur herkömmlichen Speicherung auf Computern doch immer noch enorm teuer.

So ging die Rechnung für die Sequenzierung des ersten menschlichen Genoms zur Jahrtausendwende in die Milliarden. Heute kostet diese Leistung etwa 1 000 USD, und die effizienteste Form der Datenkodierung auf DNA liegt bei etwa 3 500 USD pro Megabyte. Wenn Sie die Daten lesen möchten, kostet das jeweils nochmal etwa ein Zehntel davon. Zum Vergleich: Für einen US-Cent bekommt man derzeit etwa tausend Megabyte konventionellen Speicher.

storage size

Es gibt auch noch weitere Hindernisse. Zum Beispiel kodierten Wissenschaftler an der Universität Washington jüngst Ketten einer Schadsoftware in eine DNA, die dann von einem handelsüblichen Rechner sequenziert wurde. Die Software programmierte das Sequenziergerät um und übernahm die Kontrolle über den Rechner.

Es gibt jedoch immer mehr wirtschaftliche Faktoren, die das Speichern auf DNA günstiger und populärer werden lassen. Microsoft soll derzeit an einem operativen DNA-basierten Datenspeichersystem arbeiten, das bis zum Ende des Jahrzehnts auf den Markt kommen soll. Auch andere Unternehmen befassen sich mit der DNA-Produktion, darunter Twist Bioscience in Kooperation mit Microsoft, DNAScript, Nuclera Nucleics, Evonetix, Helixworks und Genome Foundry.

Die Geschwindigkeit der Innovation lässt darauf schließen, dass die DNA-Speicherung sich durchaus schneller durchsetzen könnte, als es gegenwärtig möglich erscheint.

  1. DNA konvertieren

    converting dna de