Variathon-kilpailu geenivirheinen paikantamiseen

Tietojenkäsittelytieteen laitoksen Genome-scale algorithmics -tutkimusryhmä on mukana järjestämässä uutta geenivirheiden paikantamiseen tähtäävää Variathon-kilpailua. Kilpailussa tutkijat pyrkivät paikantamaan DNA:sta genomivariantteja eli muutoksia organismin perimässä. Tavoitteena on laittaa nykyisiä menetelmiä järjestykseen niiden tarkkuuden ja tehokkuuden suhteen, ja tutkia minkälaiset variantit ovat haastavimpia nykyisille menetelmille. Variaatioiden etsintä on keskeisessä roolissa mm. syöpätutkimuksessa (ks. Riku Kataisen haastattelu).

Kilpailu järjestetään ensimmäistä kertaa ja on pilottivaiheessa. Kokemusten perusteella kilpailua on tarkoitus kehittää realistisemmaksi kattaen eri analysointiskenaarioita ja oikeata dataa wet lab -verifioinnilla nykyisen simuloidun datan lisäksi, sekä panostaa metriikoiden kehittämiseen simuloidun datan tulosten evaluointiin. 

Vastaavia kilpailuja on järjestetty aiemmin mm. genomien koostamisongelman (fragment assembly) sekä RNA-transkriptien ennustusongelman ympärillä.

Laitoksen opiskelijoilla on mahdollisuus osallistua kilpailun kevennettyyn versioon biologisen sekvenssianalyysin projektissa IV periodissa. Itse asiassa kyseinen projekti pidettiin ensimmäistä kertaa keväällä 2011, mistä idea Variathon-kilpailun järjestämiseen syntyi.

Mitä tarkoittaa varianttien etsintä?

Syötteenä varianttien etsinnässä on tyypillisesti tutkittavan organismin konsensusgenomi sekä tutkittavasta yksilöstä eristettyjä lyhyitä DNA-sekvenssejä. Lyhyet DNA-sekvenssit tulevat satunnaisista kohtia yksilön genomia. Niiden eroavaisuudet organismin konsensukseen voidaan jäljittää perinteisellä likimääräisellä hahmonsovituksella (sekvenssilinjauksella), missä etsitään konsensusgenonin osajono, joka on samankaltaisin annetun lyhyen DNA-sekvenssin kanssa. Sekvensointi on nykyisin niin halpaa, että satunnaisista kohdista tulevilla lyhyillä DNA-sekvensseillä on mahdollista kattaa suuri osa esimerkiksi ihmisen genomin positioista moneen kertaan. Samaan kohtaan osuvilla sekvenssilinjauksilla voidaan ennustaa varsin luotettavasti suuri osa lyhyistä varianteista. Suurempien genomivarianttien etsintään on kehitetty monimutkaisempia menetelmiä, mutta niissäkin sekvenssilinjaus on usein ensimmäinen askel. Teratavujen luokkaa olevien datajoukkojen analyysi asettaa haasteita menetelmien tehokkuudelle, varsinkin kun kyseiset analyysit ovat lähes jokapäiväistä rutiinia sadoissa bio- ja lääketieteen tutkimuslaboratorioissa.

 

27.02.2013 - 09:49 Veli Mäkinen
22.02.2013 - 12:35 Veli Mäkinen