Caroline
Publisert: 5. januar 2023

En ny milepel er nådd: resten av det menneskelige genomet er ferdig kartlagt. Forskerne har lykkes takket være ny sekvenseringsteknologi.

– Å ferdigstille den humane genomsekvensen var som å ta på nye briller. Nå som vi kan se hele sekvensen, er vi ett steg nærmere å forstå hva det hele betyr, sier forsker ved National Human Genome Research Institute i USA, Adam Phillippy, til avisen The Guardian.

Det var et enormt vitenskapelig gjennombrudd da menneskets arvemateriale, genomet, ble kartlagt for første gang for over 20 år siden. Genomsekvensen har siden vært svært viktig for å forstå alt fra menneskers opprinnelse til hvordan ulike sykdommer oppstår. Sekvensen har gjennomgått flere revisjoner siden det først ble publisert, men har likevel vært langt fra komplett: rundt åtte til ti prosent av sekvensen har manglet – inntil nå. I april i år ble kartleggingen ferdigstilt.

Arbeidet er publisert i seks separate artikler i tidsskriftet Science. Kartleggingen har tilføyd nesten 200 millioner nye bokstaver til vårt genetiske bibliotek, og gir oss dermed et nytt innblikk i oppskriften på et menneske.

Human genomprosjektet

Human genomprosjektet var en internasjonal storsatsing som tok sikte på å kartlegge hele det menneskelige genomet. Prosjektet ble lansert i 1990 og i 2003, 13 år etter lansering, ble den endelige sekvensen publisert i tidsskriftet Science. Det er estimert at prosjektet hadde en prislapp på hele 1 milliard dollar.

Kilde: https://www.genome.gov/human-genome-project

Den første versjonen av den humane genomsekvensen ble skrevet ut på papir og er i dag utstilt på Wellcome Collection i London. De 3,4 milliarder bokstavene i DNA-et fyller mer enn hundre bøker, hvor hver av dem er på tusen sider. Skriftstørrelsen er så liten at man nesten ikke kan se bokstavene. Foto: Russ London, Wikipedia, CC BY-SA 3.0

Ny sekvenseringsteknologi

DNA er oppskriftsboken for alle levende organismer. DNA-koden består av fire grunnleggende byggesteiner; A, T, C og G. Det er rekkefølgen på disse fire bokstavene som avgjør den genetiske koden i alle genene og som styrer hvordan kroppen vår fungerer og ser ut. I mennesker, består dette genomet av omtrent tre milliarder slike byggesteiner.

Å lese det menneskelige genomet innebærer å lese rekkefølgen på alle byggesteinene som DNA-et vårt består av, men DNA-et i mennesker er for langt til å kunne leses som en enkelt tråd og må først klippes opp i små biter. Forestill deg en haug med tusenvis av bøker, hvor alle sidene er kuttet opp i bittesmå biter. Først må alle bitene leses enkeltvis, og deretter skal de settes sammen igjen, slik at alle ord kommer i riktig rekkefølge. Som å pusle et gigantisk puslespill.

Noen områder i genomet har tidligere vært helt umulig for forskere å kartlegge. Dette er særlig områder hvor det befinner seg mange repeterte DNA-sekvenser. Forestill deg at sidene du klipper opp har helt identiske setninger; puslespillet du skal pusle sammen har flere tusen helt like puslebrikker (se figur). En nyere type sekvenseringsteknologi, kalt long read sequencing, gjør det mulig å lese opp til 100 000 DNA-bokstaver på én gang. Puslebrikkene er derfor større enn før og det blir lettere for forskerne å sette dem sammen igjen.

Resultatet er, ifølge forskerne i Telomere-to-Telomere (T2T)-gruppen som står bak arbeidet, en mer komplett og korrekt genomsekvens. Men hva kan vi egentlig bruke denne informasjonen til?

Den nye sekvenseringteknologien «long read sequencing», har gjort det lettere for forskerne å pusle ferdig genomsekvensen. Jo større puslebrikkene er, desto lettere blir det å sette dem sammen. Figur: Bioteknologirådet

100 nye gener

Den nye kartleggingen avdekket nesten 200 millioner nye byggesteiner i den humane genomsekvensen som aldri før har vært lest. Dette tilsvarer størrelsen på et helt kromosom.

– Ved å lese disse nye delene av genomet, tror vi vi vil finne nye genvarianter som er knyttet til ulike egenskaper og risiko for sykdom, sier Assistant Professor Rajiv McCoy, forsker ved John Hopkins University til The Guardian.

McCoy og hans kolleger spår at de nye områdene inneholder over 100 nye funksjonelle gener. Den nye sekvensen skjuler sannsynligvis også flere hemmeligheter.

– Men vi kan ennå ikke vite hva vi ikke vet, sier McCoy.

Celler med ett sett kromosomer

I tillegg til ny sekvenseringsteknologi, har forskerne bak studiene lykkes ved å bruke en helt spesiell celletype. Hvert menneske har vanligvis to kopier av hvert kromosom, ett fra mor og ett fra far. Selv om disse kromosomsettene likner veldig på hverandre, er de ikke identiske.

Siden de finnes i en blanding, har dette tidligere gjort det vanskelig å analysere deler av genomsekvensen. Forskerne løste dette problemet ved å lese DNA-et fra en type celle som, på grunn av en feil i utviklingen, kun har ett kromosomsett fra far.

Forskerne tror de vil klare å ferdigstille kartleggingen av et helt genom, med begge kromosomsettene, innen utgangen av året.

Nye utfordringer

Nå som de store hullene i genomet vårt er fylt ut, venter nye utfordringer. For det første, vil det ta tid å forstå hvilken funksjon de nyoppdagede områdene i genomet har. En annen utfordring er at den humane genomsekvensen ikke er representativ for hele verdens befolkning. Et annet internasjonalt forskningsprosjekt, The Human Pangenome project (se faktaboks), jobber med å fremstille en genomdatabase, som bedre reflekterer den globale genetiske variasjonen.

The Human Pangenome project
Et internasjonalt forskningsprosjekt som skal utarbeide en genomdatabase som er representativt for hele verdens befolkning. Prosjektet starter med en grundig analyse av 350 hele genomer av mennesker med ulik genetisk og biogeografisk bakgrunn. Informasjonen fra alle disse genomene skal deretter samles i en felles database.

Bedre, raskere og billigere genomanalyser

I januar i 2022 satte forskere fra Standford University en ny rekord: de klarte å lese hele det menneskelige genomet på bare fem timer og to minutter. I juni annonserte biotekvirksomheten Ultima Genomics at de snart vil kunne tilby helgenomsekvensering av et menneskelig genom til bare 1000 kroner, omtrent en femtedel av hva det koster i dag. Dette mener de er mulig bare ved å gjøre enkelte justeringer i teknologien. Utviklingen går altså mot bedre, raskere og billigere genomanalyser.

– I fremtiden, når noen vil få sitt genom analysert, vil vi kunne identifisere alle genetiske varianter i deres DNA og bruke den informasjonen til å bedre kunne tilpasse behandling, sier Adam Phillippy til The Guardian.

Økt innsikt i vår genetiske informasjon gir oss mange nye muligheter, men reiser også grunnleggende etiske spørsmål. Hvordan skal vi ta i bruk denne teknologien og hva skal vi bruke genetisk informasjon til? Hvem skal få adgang til andres genetiske data? Hvem eier informasjonen når ny kunnskap kommer fra mitt eller ditt DNA? Skal foreldre få lov til å få tilgang til sine barns genetiske informasjon?

Dette er spørsmål som allerede ble reist da den første kartleggingen ble ferdigstilt, men som kanskje er enda mer aktuelle i dag.

Kilder:
Nurk. Science (2022) doi:10.1126/science.abj6987
Aganezov. Science (2022) DOI: 10.1126/science.abl3533
Vollger. Science (2022) DOI: 10.1126/science.abj6965
Altemose. Science (2022) DOI: 10.1126/science.abl4178
Hoyt. Science (2022) DOI: 10.1126/science.abk3112
Gershman. Science (2022) DOI: 10.1126/science.abj5089
https://www.theguardian.com/science/2022/mar/31/first-complete-gapfree-human-genome-sequence-published