Annotering (genetisk annotering)

Annotering innebär att man tilldelar biologisk mening till en DNA-sekvens, exempelvis genom att markera var gener finns och vilken funktion olika delar av arvsmassan har.

När forskare har avläst ett genom får de först bara en lång rad bokstäver som representerar baspar i DNA:t. Dessa bokstäver säger i sig själva ingenting om var generna ligger eller vad de gör. Annotering är processen där man kopplar information och tolkningar till sekvensen, så att den råa datan blir begriplig och användbar.

Man brukar dela in arbetet i två huvuddelar. Den strukturella annoteringen handlar om att identifiera var olika element finns i sekvensen, till exempel var en gen börjar och slutar, var de proteinkodande delarna ligger och var reglerande områden finns. Den funktionella annoteringen handlar i stället om att beskriva vad dessa element gör, exempelvis vilket protein en gen ger upphov till eller vilken biologisk process den är inblandad i.

Ett konkret exempel: tänk dig att en gensekvens jämförs med stora databaser där tidigare beskrivna gener redan finns lagrade. Om en ny sekvens liknar en känd gen som styr produktionen av ett visst enzym, kan den nya sekvensen annoteras med samma trolig funktion. På så vis byggs kunskapen upp steg för steg, ofta med hjälp av automatiska dataprogram som senare granskas av forskare.

För den som har gjort ett DNA-test har annotering stor betydelse även om man sällan ser ordet i resultaten. När ett testföretag rapporterar att en viss genetisk variant är kopplad till en egenskap eller en ökad risk för något, bygger det på annoterad information om vad just den positionen i arvsmassan betyder. Utan annotering skulle resultatet bara vara en sifferkod utan tolkning.

Annotering är inte heller statisk. I takt med att forskningen går framåt uppdateras tolkningarna, och en variant som tidigare ansågs oklar kan senare få en tydligare beskrivning. Därför kan analyser av samma genom ge olika svar beroende på när och med vilka databaser de utförs.

Sammanfattningsvis är annotering bryggan mellan rådata och kunskap. Det är genom denna process som en oöverskådlig mängd DNA-bokstäver förvandlas till information som går att förstå, jämföra och använda inom både medicin och forskning.