Publisert: 23. august 2017

DIgitalt DNA
De to siste årene er det generert mer data på verdensbasis enn alle tidligere år i historien sammenlagt. Foto: iStock.

Verden produserer mer data enn noensinne, og trenger nye måter å lagre alt sammen på. Kan løsningen være å lagre informasjon i DNA?

Av Sigrid Bratlie i tidsskriftet GENialt

I en kjeller på Universitetet i Oslo står dataservere på rekke og rad. Til sammen rommer de rundt 20 petabyte, eller 20 milliarder megabyte, med data fra hele landet. Dette gjør universitetets senter for informasjonsteknologi (USIT) til Norges største fasilitet for datalagring og -analyse. Likevel er kapasiteten under press.

De to siste årene er det generert mer data på verdensbasis enn alle tidligere år i historien sammenlagt. Helsesektoren er en stor bidragsyter. Det forventes blant annet at plasskrevende data generert fra DNA-sekvensering av pasienter vil mer enn tidobles fra 2016 til 2018, forteller Gard Thomassen, seksjonssjef for IT i forskning hos USIT.

– Behovet for datalagring har vokst mye raskere enn behovet for prosessorkapasitet den siste tiden. Likevel gjøres det lite for å utvikle nye lagringsløsninger. Vi trenger løsninger som er smartere og mindre plasskrevende enn de vi har i dag, mener han.

Kanskje kan deler av UiOs datalager i fremtiden bli erstattet av en liten fryseboks med DNA?

Gjennombrudd i år

Ny forskning viser nemlig at én mulig løsning kan være å lagre data i DNA. DNA inneholder enorme mengder informasjon (kjemiske baser) pakket tett sammen på bitteliten plass. I tillegg er DNA et stabilt molekyl, spesielt ved lave temperaturer. Forskere har derfor utviklet systemer for å oversette digital datakode til kjemiske baser som settes sammen til DNA-molekyler. Dermed blir det mulig å lagre informasjon i DNA.

Gard Thomassen, USIT.
Gard Thomassen, USIT.

De to amerikanske forskerne Yaniv Erlich og Dina Zielinski stod bak et gjennombrudd på feltet tidligere i år. De oversatte blant annet et helt dataoperativsystem og en kortfilm til «DNA-språk» i form av de fire bokstavene A, G, C og T. Dette ble sendt som tekstfiler til et biotek-selskap, som laget DNA-molekyler basert på tekstfilene. To uker senere kom DNA-et i et lite plastrør i postkassa til Erlich og Zielinski. Da de sekvenserte DNA-et og konverterte dataene tilbake til sin originale form, var de helt uten feil. De kunne også lage et nærmest ubegrenset antall kopier av «DNA-filene» gjennom en standard DNA-kopieringsmetode som kalles PCR (Polymerase Chain Reaction).

Med denne metoden kan man lagre 215 petabyte, det tidobbelte av alle dataene som i dag er lagret hos USIT, i ett gram DNA. I teorien kan man få plass til all verdens data som så langt er produsert i ett eneste rom.

Muligheter og utfordringer

Thomassen mener DNA-lagring er en av de bedre idéene om datalagring som har blitt lansert på en stund. Han trekker likevel frem en utfordring med teknologien.

– Det vil ta tid å hente ut dataene, siden DNA-et må sekvenseres for å avleses. For data som stadig skal bearbeides og analyseres, må vi finne smarte måter for å gjøre prosessen rask nok, sier han.

Under det amerikanske forsøket kostet det 30 000 kroner å produsere én megabyte data i DNA, og ytterligere 8000 kroner å lese dem av igjen. Til sammenligning koster det 0,16 øre å lagre én megabyte data hos USIT med dagens system. Det er derfor nødvendig å få ned kostnadene.

Prisen på produksjon og sekvensering faller imidlertid stadig. Lagring i DNA har også noen særegne fordeler, som at den ikke er sårbar for elektromagnetiske bomber eller datavirus. Microsoft mener teknologien er så lovende at de har en uttalt langsiktig ambisjon om at deres data som skal arkiveres skal lagres i DNA

————–

Fakta: DNA

DNA er bygget opp av lange kjeder av de kjemiske basene adenin (A), cytosin (C), guanin (G) og thymin (T). Rekkefølgen på basene danner en kode som avleses og oversettes til andre molekyler som cellen trenger, litt som når man leser en oppskrift og bruker den til å lage en matrett.