Referensgenom

Ett referensgenom är en standardiserad, sammansatt DNA-sekvens som fungerar som jämförelsemall för en hel art. Inom genetik och DNA-tester används den för att placera och tolka enskilda individers genetiska information.

Ett referensgenom är inte en kopia av en enskild människas arvsmassa, utan en gemensam karta som forskare har byggt utifrån DNA från flera personer. Tanken är att skapa en representativ mall som visar hur den mänskliga arvsmassan ungefär ser ut, position för position. När ett laboratorium analyserar ditt prov jämförs dina data mot denna mall, vilket gör det möjligt att se exakt var i genomet olika varianter finns.

Det mest kända exemplet är det mänskliga referensgenomet som först togs fram genom det internationella Human Genome Project. Sedan dess har det uppdaterats i flera versioner. Två beteckningar du ofta stöter på är GRCh37 (även kallad hg19) och GRCh38 (hg38). Siffrorna anger vilken byggversion som använts. Detta är viktigt eftersom positionerna för en och samma genetiska variant kan skilja sig mellan versionerna. Om du laddar upp dina rådata till olika tjänster kan resultatet därför ibland skilja sig beroende på vilket referensgenom som ligger till grund.

Varför det behövs

Människans arvsmassa består av över tre miljarder byggstenar. För att kunna säga något meningsfullt om en individs DNA behöver man en fast utgångspunkt att jämföra mot. Referensgenomet ger varje position en adress, ungefär som husnummer längs en gata. Tack vare detta kan en avvikelse beskrivas på ett standardiserat sätt, till exempel att en viss byggsten har bytts ut på en bestämd plats på en viss kromosom.

Betydelse för DNA-tester

När du gör ett autosomalt DNA-test för släktforskning analyseras hundratusentals positioner som väljs ut just för att de ofta varierar mellan människor. Dessa positioner definieras utifrån referensgenomet. Även hälsorelaterade analyser bygger på samma princip: en sjukdomskopplad variant beskrivs alltid i förhållande till referensen.

En viktig insikt är att referensgenomet bygger på ett begränsat urval personer och därför inte representerar mänsklighetens hela mångfald lika väl. Nyare projekt arbetar med så kallade pangenom, som samlar många olika genom för att ge en mer rättvisande bild av den genetiska variationen mellan folkgrupper.