Read mapping (läsmappning)
Read mapping är den process där korta DNA-sekvenser, så kallade reads, placeras ut mot ett känt referensgenom för att avgöra varifrån i arvsmassan de kommer. Det är ett grundläggande steg i analysen av data från modern DNA-sekvensering.
När ett DNA-prov sekvenseras med moderna metoder läses inte hela arvsmassan av i ett enda svep. I stället bryts DNA:t upp i miljontals små fragment som var och en avläses som korta sekvenser av bokstäverna A, T, C och G. Dessa korta avläsningar kallas reads och kan vara allt från ett femtiotal till några hundra baspar långa. Problemet är att man från början inte vet var i genomet varje enskild read hör hemma.
Här kommer read mapping in. Med hjälp av datorprogram jämförs varje read mot ett referensgenom, alltså en redan kartlagd och sammansatt version av artens arvsmassa. Programmet letar efter den position där sekvensen passar bäst in. Eftersom det mänskliga genomet består av över tre miljarder baspar krävs smarta algoritmer för att detta ska gå snabbt. Verktyg som BWA och Bowtie använder effektiva sökmetoder för att placera ut enorma mängder reads på rätt plats.
Ett konkret exempel: tänk dig att referensgenomet är en färdiglagd bild på en jättelik karta, medan dina reads är tusentals små kartbitar i en hög. Read mapping handlar om att för varje bit hitta exakt var den passar in på den stora kartan. När alla bitar är placerade kan man se hur väl din DNA-sekvens stämmer med referensen, och var det finns skillnader.
De skillnader som upptäcks, exempelvis att en read har ett G där referensen har ett A, är ofta de mest intressanta. De kan motsvara genetiska varianter som gör oss unika, påverkar egenskaper eller är kopplade till sjukdomar. För att en variant ska anses tillförlitlig brukar man kräva att flera reads täcker samma position, något som kallas täckningsdjup.
Inom släktforskning och konsumenttester bygger mycket av analysen på liknande principer, även om de flesta DNA-test för släktforskning använder så kallad mikroarrayteknik snarare än fullständig sekvensering. Read mapping är dock helt avgörande inom helgenomsekvensering, medicinsk genetik och forskning, eftersom det utgör bron mellan rådata och tolkningsbara resultat.
