Geenien aktiivisuuden tarkin mittari syntyi suomalais-brittiläisenä yhteistyönä

Akatemiatutkija Antti Honkelan tutkimusryhmän ja Manchesterin yliopiston tutkijoiden yhdessä kehittämä analyysiohjelma BitSeq on todettu laajassa
kansainvälisessä vertailussa tarkimmaksi RNA-sekvensointitietoon pohjautuvaksi geenien transkriptien aktiivisuustason analyysimenetelmäksi. Menetelmä perustuu todennäköisyysmallinnukseen, jossa huomioidaan mittauksiin liittyvät epävarmuudet.

RNA-sekvensointi mahdollistaa ihmisen tai muun organismin geenien aktiivisuuden mittaamisen. Menetelmä on noussut viime vuosina suosituksi biotieteiden ja lääketieteen tutkimuksessa, ja se on tulossa käyttöön myös kliinisissä sovelluksissa. Yksi RNA-sekvensoinnin mahdollisuuksista aiempiin menetelmiin verrattuna on mahdollisuus tutkia geenin erilaisia aktiivisia muotoja, transkripteja, joita muodostuu muun muassa vaihtoehtoiseksi silmukoinniksi kutsutun prosessin myötä.

RNA-sekvensointi tuottaa suuren määrän tietoa, jonka analysointi vaatii monia edistyneitä laskentamenetelmiä. Erityisesti transkriptitason analyysi on vaativaa, ja siksi erilaisten menetelmien erot korostuvat.

Nyt julkaistussa vertailussa Helsingin yliopiston ja Manchesterin yliopiston BitSeq tuotti selkeästi luotettavimmat tulokset tässä tehtävässä. Eräässä osavertailussa se pystyi tuottamaan vastaavat tulokset puolet pienemmällä aineistolla kuin erittäin laajasti käytetty vaihtoehtoinen menetelmä.

- BitSeq-menetelmä perustuu todennäköisyysmallinnukseen, joka mahdollistaa alkuperältään epävarmojen havaittujen sekvenssipätkien mahdollisten alkuperien vertailun. Tämän avulla voidaan laskea kunkin geenin eri transkriptien aktiivisuustasojen todennäköisyysjakaumat, jotka huomioivat mittauksiin liittyvän epävarmuuden ja virhelähteet. Tämän epävarmuuden huomioiminen todennäköisyyksien avulla on menetelmän tarkkuuden kannalta keskeistä, Antti Honkela kuvailee.

Vertailuartikkeli:
SEQC/MAQC-III Consortium. (2014). A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium. Nature Biotechnology. doi:10.1038/nbt.2957

BitSeq-menetelmän kuvaus:
Glaus, P., Honkela, A., & Rattray, M. (2012). Identifying differentially expressed transcripts from RNA-seq data with biological variation. Bioinformatics:28(13), 1721-1728. doi:10.1093/bioinformatics/bts260

Katso myös: Helsingin yliopiston tiedote, Suomen Akatemian tiedote

Lisätietoja antaa akatemiatutkija Antti Honkela, Tietotekniikan tutkimuslaitos HIIT, tietojenkäsittelytieteen laitos, Helsingin yliopisto, p. 050 311 2483, antti.honkela@hiit.fi

04.09.2014 - 14:58 Antti Honkela
04.09.2014 - 14:58 Antti Honkela