Fehlerfreier Datenspeicher aus DNA-Molekülen

Spezieller Algorithmus schöpft Potenzial für enorme Datendichte aus – 215.000 Terabyte pro Gramm
DNA-Massenspeicher: Yaniv Erlich und Dina Zielinski bei der Entwicklung ihres Datenspeichers aus Erbgut-Strängen.
DNA-Massenspeicher: Yaniv Erlich und Dina Zielinski bei der Entwicklung ihres Datenspeichers aus Erbgut-Strängen.
© New York Genome Center
New York (USA) - Moderne Festplatten speichern mehrere Tausend Gigabyte digitaler Daten. Und mit immer feineren Strukturen wird die Kapazität der magnetischen Speichermedien stetig erhöht. Aber weitaus größere Speicherkapazitäten sind prinzipiell mit DNA-Molekülen möglich. Die dazu nötige Codierung digitaler Daten mit den vier Nukleinbasen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T) demonstrierten nun amerikanische Forscher mit einem etwa zwei Megabyte großen Datenpaket. In der Fachzeitschrift „Science“ berichten sie, dass nur ein Gramm DNA-Moleküle ausreichen, um die enorme Datenmenge von 215.000 Terabyte dauerhaft zu speichern.

„Wir glauben, mit unserem Versuch die höchste Speicherdichte für Daten überhaupt erreicht zu haben“, sagt Yaniv Erlich von der Columbia University in New York. Diese Aussage gründet auf einem Experiment, das Erlich gemeinsam mit seiner Kollegin Dina Zielinski vom New York Genome Center durchgeführt hat. Sie schnürten aus einem kurzen Video, einem schlanken Betriebssystem und weiteren Bild- und Textdateien ein komprimiertes Datenpaket von insgesamt 2.146.816 Byte. Dieses Paket zerlegten sie darauf in 67.088 Segmente zu je 32 Byte. Jedes Paket ergänzten sie um sechs Byte, die der Fehlerkorrektur dienten und die Position der aneinander gereihten Segmente codierten.

Jedes Segment bestand aus einer Folge von insgesamt 304 Nullen und Einsen. Diese ordneten Erlich und Zielinski mit ihrem Algorithmus einer Folge aus den vier Buchstaben A, G, C und T zu, entsprechend der vier verfügbaren Nukleinbasen. Nicht eindeutig zuzuordnende Buchstabenfolgen wurden dabei vermieden. Es entstand eine einfache Textdatei mit dem Bauplan für 72.000 DNA-Stränge aus jeweils 200 Nukleinbasen.

Diese Datei sandten sie an ein Unternehmen in Kalifornien, das mit mittlerweile etablierten biochemischen Verfahren synthetische DNA-Stränge entsprechend der Bauplanliste herstellen konnte. Nach zwei Wochen erhielten Erlich und Zielinski einen kleinen Flakon mit den synthetisierten DNA-Schnipseln. Mit ebenfalls bereits kommerziell verfügbaren Sequenzierautomaten lasen sie diese DNA-Stränge wieder aus und rekonstruierten mit dem ursprünglich verwendeten Algorithmus die Zahlenfolge aus Nullen und Einsen. Alle anfangs genutzten Dateien konnten so wiederhergestellt und fehlerfrei ausgelesen werden. Selbst über das PCR-Verfahren, die Polymerase-Kettenreaktion, duplizierte DNA-Stränge enthielten die exakt identischen Informationen. Zur Demonstration betrachteten die Forscher die Video-, Bild- und Textdateien und konnten auch das Betriebssystem erfolgreich auf einem Rechner installieren.

Dieser Grundlagenversuch belegt, dass DNA-Stränge für eine Speicherung digitaler Daten prinzipiell geeignet sind. Kann eine Nukleinbase theoretisch exakt zwei Bit speichern, erreichten die Forscher wegen der zu ergänzenden Byte für eine Fehlerkorrektur und Positionsangabe immerhin einen Wert von 1,6 Bit pro Nukleinbase. Daraus ergab sich rechnerisch eine Speicherdichte von 215 Petabyte pro Gramm. Der Aufwand dieser Technologie ist derzeit allerdings noch ausgesprochen groß. Allein die Herstellung der künstlichen DNA-Stränge und das Sequenzieren kosteten etwa 9.000 US-Dollar. Doch Erlich und Zielinski erwarten, dass diese Kosten in Zukunft noch drastisch sinken könnten.

Als Alternative zur täglich genutzten Festplatte taugt diese DNA-Datenspeicherung aber nicht. Vielmehr könnten in Zukunft solche Speicher aus Erbgut-Molekülen für möglichst langlebige Datenarchive genutzt werden. Von Vorteil wäre nicht nur die extrem hohe Datendichte, sondern auch die Stabilität von DNA-Molekülen. In kühler und trockener Umgebung erwarten die Forscher eine Haltbarkeit von Hunderttausenden von Jahren. Diese Annahme begründen sie mit einem Fund intakter DNA in Knochen von Frühmenschen, die vor etwa 430.000 Jahren im heutigen Spanien gelebt hatten.

© Wissenschaft aktuell


 

Home | Über uns | Kontakt | AGB | Impressum
© Wissenschaft aktuell & Scientec Internet Applications + Media GmbH, Hamburg