Det er den tiden på året hvor gruppen vår åpner en dør i adventskalenderen vår igjen. Det er min tur til å åpne den første døren. Gruppen vår er involvert i mange forskningsprosjekter som involverer genomdata, som du kan se når du ser på de tidligere innleggene våre. Parallelt pågår det mange storskala genomforskningsprosjekter som BGE, EBP-Nor, ATLAsea og DToL. Dermed vokser den genomiske informasjonen, spesielt av høy kvalitet eller til og med på referansekromosomnivå, som er tilgjengelig for forskningsprosjekter, med stormskritt. I begynnelsen konsentrerte mange prosjekter seg om ikoniske arter og modellarter for å gjøre det attraktivt for finansiører å investere. Det er en økende forståelse blant finansiører og allmennheten at vi ikke kan forstå det biologiske mangfoldet og det underliggende genomiske grunnlaget ved bare å konsentrere oss om disse artene. Følgelig får vi mer og mer finansiering for å ta for oss det biologiske mangfoldet i sin helhet for å generere genomiske data, for eksempel på nasjonalt nivå eller for bestemte habitater. Spørsmålet er nå om vi nærmer oss målet, eller om det fortsatt er skjevheter i hvilket biologisk mangfold vi dekker i disse prosjektene.
Når man ser på resultatene av all denne innsatsen, er det fortsatt en stor skjevhet til fordel for visse deler av det biologiske mangfoldet. Til tross for alle de teknologiske fremskrittene det siste tiåret har selv de mest moderne metodene sterke begrensninger når det gjelder DNA-kvalitet og -mengde. Dette omtales ofte med begreper som gjennomførbarhet. I BGE-prosjektet hadde vi for eksempel en samfunnsbasert tilnærming. I denne tilnærmingen kunne det europeiske vitenskapelige samfunnet foreslå arter som de kunne levere prøver av for å generere referansegenomer. Omtrent halvparten av de foreslåtte artene ble vurdert som ikke gjennomførbare ut fra de gjennomførbarhetskriteriene som ble satt av de deltakende sekvenseringssentrene. Når vi ser på figuren nedenfor, ser vi at for noen av rekkene som det var foreslått arter fra, var alle gjennomførbare. For et tilsvarende antall rekker var imidlertid ingen av de foreslåtte artene gjennomførbare. Ettersom vi kommuniserte kriteriene for gjennomførbarhet og at disse artene ikke ville bli valgt, kan vi dessuten anta at antallet arter som ikke var gjennomførbare, ville være høyere. Dette kan også omfatte rekker, der alle artene i dette eksemplet var gjennomførbare. Et slikt eksempel er flatormer, der ingen av de meiofaunale representantene var foreslått, noe som ville ha blitt vurdert som ikke gjennomførbart på grunn av deres lille kroppsstørrelse. Noen rekker som bare består av små arter, som Gastrotricha, ble ikke engang foreslått i utgangspunktet. Hva er det som ikke er gjennomførbart, og hva kan vi gjøre med det?
Gjennomførbarhetskriteriene ble sjekket for ulike aspekter ved de utvalgte artene og prøvetakingsprosessen for å sikre en smidigere generering av referansegenomer ved hjelp av tilgjengelig teknologi. Med tanke på den begrensede tilgjengelige finansieringen var genomstørrelsen ett av dem, ettersom store genomer krever en stor mengde DNA av høy kvalitet, men også mye sekvensering. Derfor blir det fort dyrt. Et annet kriterium er hvor mye vev som kan brukes til å generere referansegenomer innenfor en rimelig tidsramme. Det finnes i dag protokoller som gjør det mulig å arbeide med mye mindre DNA enn for et par år siden. Likevel anses alle arter som er mindre enn for eksempel en bananflue, fortsatt som ugjennomførbare. Til slutt må preservering, lagring og transport av vevet frem til ekstraksjon av DNA skje på best mulig måte for å sikre høyest mulig kvalitet på DNA-et. Dette betyr vanligvis at vevet fryses ned i flytende nitrogen eller på tørris, og at prøven deretter alltid oppbevares ved -70 °C.
Når vi ser på de artene som ikke var gjennomførbare i BGE-prosjektet, ser vi at omtrent en femtedel hadde for store genomer, en annen femtedel kunne ikke levere materiale innen rimelig tid, omtrent en tredjedel hadde for liten prøvestørrelse, og halvparten kunne ikke konservere vevet på en hensiktsmessig måte eller holde kjølekjeden. Noen arter oppfylte mer enn ett av disse kriteriene. Dette indikerer at til tross for alle de teknologiske fremskrittene innen sekvensering, byr en stor del av det eukaryote biologiske mangfoldet fortsatt på betydelige utfordringer når det gjelder å generere referansegenomer, fordi de er for små, for sjeldne eller fordi genomet er for stort. Følgelig er det behov for mer forskningsinnsats for å gjøre sekvensering av referansegenomer mulig for en mye større del av det biologiske mangfoldet.
På den annen side ble omtrent halvparten av artene ekskludert, ikke på grunn av utfordringer med sekvenseringsteknologien, men på grunn av utfordringer med prøvetakingsprosedyren. Dette betyr at det må utvikles løsninger som bygger opp kapasiteten og logistikken for å bevare og lagre prøver på riktig måte for genomisk forskning. For eksempel må det være tilgang til tørris eller flytende nitrogen, slik at man kan konservere og korttidslagre prøver i tide, selv i avsidesliggende områder. Infrastruktur for langtidslagring må også være lett tilgjengelig for å opprettholde en forsvarlig kjølekjede. Å bygge opp slike infrastrukturer og protokoller vil også være fordelaktig for arter som det ikke er lett å samle inn. Med slike midler på plass vil terskelen for å samle inn arter til genomforskning på biologisk mangfold for ikke-eksperter på genomforskning bli betydelig lavere, og dermed kan for eksempel taksonomer lettere overbevises om å samle inn prøver til genomforskning under feltarbeidet bare på grunn av den mulige sjansen for at de kan være egnet for sekvensering i fremtiden. Selv med alle disse tiltakene på plass vil det imidlertid fortsatt være utfordrende å få tak i optimalt bevart materiale for flere arter, fordi de må samles inn i områder som dyphavet, på avsidesliggende øyer eller i høyalpine fjellområder, som ikke er lett tilgjengelige. Derfor vil det være svært nyttig å utvikle sekvenseringsprotokoller for suboptimalt bevart og vedlikeholdt materiale for slike prøver.
Hvis vi virkelig ønsker å sekvensere et referansegenom for hver eukaryote art, kan vi ikke fortsette slik vi gjør nå. Fra å velge ut ikoniske arter har vi gått over til å velge ut arter som er gjennomførbare, for enkelt å oppfylle finansiørenes forventninger. Dette vil imidlertid føre til en sterk skjevhet, og forskningen og utviklingen av nye metoder for dette biologiske mangfoldet må skje nå, og det samme gjelder oppbyggingen av den nødvendige infrastrukturen. Hvis vi venter med dette til vi når den store produksjonsfasen av genomer, vil vi veldig raskt uttømme de mulige artene og plutselig oppleve et stort fall i genomproduksjonen når den burde pumpe ut genomer på daglig basis. Hvis vi begynner å utvikle metoder da, kan det sette hele prosjektet i fare, ettersom finansieringsinstitusjonene vil lure på hvorfor vi ikke kan levere den forventede produksjonen. Dessuten vil det gi oss et skjevt syn på det genomiske mangfoldet som finnes i verden.
Det finnes imidlertid håp. Noen få prosjekter, som vårt eget InvertOmics-prosjekt, har begynt å se nærmere på noen av disse utfordringene. Vi har for eksempel bevisst valgt å jobbe med arter med liten kroppsstørrelse for å finne måter å skaffe genomer for dem på. Selv om vi ikke kan få dem ned på referansekromosomnivå, kan vi kanskje generere så mye informasjon at vi i det minste får et genom av svært høy kvalitet. Vår første vellykkede tilnærming har nylig blitt akseptert for publisering, og vi vil presentere den i et eget innlegg snart. I tillegg er to masteroppgaver i ferd med å bli ferdige som også undersøker slike arter. Vi vil her presentere utfordringene disse artene ga, og suksessene studentene hadde etter at de hadde fullført sine oppgaver. Dette er imidlertid bare en liten innsats, og samfunnet som helhet må legge mer innsats i dette. Spesielt hvis man tar i betraktning at det er enda flere utfordringer i vente også fra de artene som anses som gjennomførbare. Dette er også noe vi lærer av BGE eller andre tiltak som InvertOmic-prosjektet vårt. Naturen kaster oss ofte en kurveball med nye aspekter av livet.
FDerfor står den genomiske forskningen på biologisk mangfold ved et veiskille akkurat nå. Vil vi fortsette å følge den enkle veien og neglisjere store deler av det biologiske mangfoldet med all den nye kunnskapen vi kan få ut av det, eller vil vi gå den humpete veien og begi oss ut i ukjent farvann med tilbakeslag og stort engasjement, både når det gjelder penger og arbeidskraft?
Derfor, quo vadis genomisk forskning på biologisk mangfold?
Teksten er oversatt fra den engelske versjonen ved hjelp av DeepL.