Yliopiston etusivulle Suomeksi På svenska In English
Helsingin yliopisto Tietojenkäsittelytieteen laitos
 

Vuosikertomus 2006

Tutkimusprojektit

Bioinformatiikka

Infektiot ja ihmisen genomin alkuperä. Ihmisen endogeeniset retrovirukset, terveys ja sairaudet - Infectious origins of the human genome. Human endogenous retroviruses in health and disease (MICMAN)

Ajankohta: 1/2003 - 12/2006
Tutkijat: Merja Oja, Jaakko Peltonen, Samuel Kaski
Rahoitus: Suomen Akatemia

Projektissa tutkitaan vuorovaikutusta virusparasiittien, symbioottien ja ihmisisännän välillä. Eläinten ja kasvien genomeihin on tunkeutunut transposoneja, joista retrovirussekvenssejä on suuri osa. Projektista saatava tieto on tärkeää sekä pitemmällä aikavälillä, ihmisten tulevaisuuden ymmärtämiseksi, että myös lyhyemmällä aikavälillä sairausmekanismien ymmärtämiseksi ja mahdollisten geenihoitojen kehittämiseksi.

Projektissa kehitetään bioinformatiikan menetelmiä, joilla voidaan löytää retrovirussekvenssejä ihmisgenomista ja luonnehtia niitä. Löydöksiä yhdistetään sekvenssien ilmenemisdataan. Ohjatuilla koneoppimistekniikoilla pyritään löytämään virussekvenssejä ja ohjaamattomilla data-analyysi- ja tiedon louhintatekniikoilla pyritään luonnehtimaan sekvenssien ominaisuuksia. Ihmisgenomin retrotransposonisisällöstä luodaan tietokanta ja se yhdistetään tietoon transposonien ilmenemisestä eri kudoksissa. Ihmisen endogeenisten retrovirusten (erään tyyppinen ihmisen transposoni) on havaittu ilmenevän sekä terveissä että sairaissa kudoksissa. Ei kuitenkaan tiedetä mitkä nimenomaiset retrovirukset aktivoituvat. Tätä ongelmaa ratkaisemaan olemme kehittäneet piilo-Markov -malleihin pohjautuvat tilastollisen sekoitetiheysmallin, joka pystyy oppimaan yksittäisten retrovirusten (retrovirussekvenssien) aktiivisuustasot aktiivisia sekvenssejä listaavista tietokannoista. Osoitimme myös empiirisesti, että yksinkertainen nopeampi heuristinen menetelmä pystyy riittävän hyvin estimoimaan retrovirusten aktiivisuustasot. Tätä nopeaa menetelmää käyttäen selvitimme 2450 ihmisen endogeenisen retroviruksen aktiivisuustasot; näistä suurin osa oli ennalta tuntemattomia. Tulokset osoittivat, että noin 7% ihmisen endogeenisista retroviruksista on aktiivisia ja että aktiiviset yksilöt ovat sekalaisen tyyppisiä endogeenisia retroviruksia. Kokeet simuloidulla aineistoilla osoittavat myös että menetelmämme estimoivat aktiivisuudet tarkasti.

 

Metaboliadynamiikan ja geeniekspression säätelyn systeemisiä malleja - Systemic models for metabolic dynamics and regulation of gene expression

Ajankohta: 1/2004 - 4/2006
Tutkijat: Janne Nikkilä, Antti Ajanki, Janne Sinkkonen, Tapio Rinnet, Samuel Kaski
Rahoitus: Tekesin Mallinnus ja simulointi -ohjelma

Projektissa kehitetään uusia laskennallisia menetelmiä geenien säätelyverkkojen mallitukseen, sovelletaan niitä hiivan systeemibiologiassa, ja integroidaan ne analyysityökaluihin. Erityisesti mallitetaan stressireaktion osuutta geeninpoistomutaatiokokeissa sekä hiivan säätelyproteiinien vaikutusta stressireaktiossa.

Projektissa on kehitetty uusi menetelmä geenien säätelyn muuttumisen estimointiin eri olosuhteissa. Menetelmä perustuu Bayes-verkkoihin ja niihin projektissa kehitettyyn muunnelmaan, joka keskittyy riippuvuuksien muuttumiseen eri tilanteiden välillä. Menetelmää on sovellettu hiivan geenien säätelyn arvioimiseen stressireaktion aikana. Menetelmä mahdollistaa myös säätelytekijöiden sitoutumisaineiston yhdistämisen hiivan geenien ilmenemisaineistoihin, ja sillä on löydetty uusia hypoteeseja geenien säätelyvuorovaikutuksiksi stressin aikana. Ohjelmistototeutus on tarkoitus julkaista vuoden 2007 aikana.

Lisäksi projektissa on sovellettu uutta, tutkimusryhmässä kehitettyä laskennallisesti hyvin yksinkertaista menetelmää, jolla voidaan hakea useille tietoaineistoille yhteiset piirteet. Menetelmää on sovellettu erottamaan hiivan stressireaktio muusta hiivan toiminnasta, mikä on tärkeää mm. pyrittäessä ymmärtämään geeninpoistokokeiden vaikutusta hiivan metaboliaan. Kanoniseen korrelaatioanalyysiin perustuva menetelmä on yleiskäyttöinen, ja sille on odotettavissa myös muita sovelluskohteita. Projektissa on kehitetty ohjelmistototeutus, joka integroidaan yhteistyökumppanin ohjelmistoalustaan.

Oppivia menetelmiä bioinformatiikkaan - Learning methods for bioinformatics

Ajankohta: 1/2005 - 12/2007
Tutkijat: Abhishek Tripathi, Jaakko Peltonen, Antti Ajanki, Samuel Kaski
Rahoitus: Helsingin yliopiston tutkimusvarat

Projektissa kehitetään menetelmiä erilaisten biologisten mittausaineistojen yhdistämiseen ja taustatiedon käyttämiseen uusien mittaustulosten analysoinnissa. Monissa biologisissa tutkimuskysymyksissä pystytään tekemään mittauksia vain pienestä määrästä näytteitä, mutta yhdestä näytteestä saadaan mikrosirutekniikoiden ansiosta jopa satoja tuhansia arvoja. Tämänkaltaisen aineiston analysointi on haastavaa ja vaatii biologisen taustatiedon käyttämistä hyväksi.

Projektissa kehitetään uusia laskennallisia menetelmiä, joilla analyysin apuna voitaisiin käyttää aiemmin kerättyjä mittauksia, tai joilla suurista mittauskokoelmista voitaisiin tehokkaasti ja automaattisesti muodostaa taustatietoa uutta aineistoa varten. Projektissa on toistaiseksi kehitetty ratkaisut kolmeen tämän yleisen ongelmakentän osatehtävään. Aineistojen yhdistämiseen (data fusion) on kehitetty nopea lineaarinen esikäsittelymenetelmä, joka säilyttää eri aineistoille yhteisen tiedon ja hylkää aineistospesifin tiedon. Toisaalta olemme kehittäneet nopean menetelmän aineistoluokkia kuvaavien komponenttien hakuun (diskriminatiiviset komponentit). Kolmanneksi olemme kehittäneet geenien säätelyverkkojen analysointiin Bayes-verkkoihin perustuvan menetelmän, jolla löydetään tilannekohtaisia säätelyvuorovaikutusten muutoksia.

 

Entsyymien kehityshistorian mallintaminen - Modelling functional shifts in enzyme evolution (UR-ENZYMES)

Ajankohta: 1/2006-12/2008
Tutkijat: Juho Rousu, Katja Astikainen, Esa Pitkänen, Liisa Holm (Biotekniikan instituutti)
Rahoitus: Suomen Akatemia

UR-ENZYMES on monitieteinen projekti, joka yhdistää koneoppimisen genomiikkaan pyrkien selittämään molekyylien kehityshistoriaa. Projektissa luodaan uusia algoritmeja genomisen tiedon louhintaan, vertailevaan genomiikkaan ja aineenvaihduntareittien rekonstruointiin. Projektin ytimen muodostaa entsymaattisten reaktioiden esittäminen sellaisessa muodossa, että siinä voidaan jäljittää entsyymigeenien funktioiden muuntumista toisikseen biologisen evoluution kuluessa. Vuonna 2006 projektissa keskityttiin piirrekuvauksien kehittämiseen entsyymisekvensseille ja kemiallisille reaktiolle sekä näitä hyödyntävien koneoppimismenetelmien kehittämiseen.

Fysiologian säätelyn systeemibiologinen analyysi - Experimental and computational analysis of physiological regulation at transcriptome, proteome and metabolome level (SYSFYS)

Ajankohta: 1/2004-12/2007
Tutkijat: Juho Rousu, Esko Ukkonen, Ari Rantanen, Paula Jouhten, Esa Pitkänen
Rahoitus: Suomen Akatemia (SYSBIO-ohjelma)

Helsingin yliopiston tietojenkäsittelytieteen laitoksen, biotekniikan instituutin sekä VTT:n muodostaman SYSFYS-tutkimuskonsortion tavoite on kehittää ja soveltaa edistyneitä kokeellisia ja laskennallisia menetelmiä solun aineenvaihduntareittien analysointiin.

Vuoden 2006 merkkitapaus oli Ari Rantasen väitöskirja, joka veti yhteen metaboliareittien fluksiestimaatiossa saavutetut tutkimustulokset. Lisäksi projektissa tutkittiin uusia tehokkaita metaboliaverkkojen rekonstruktioalgoritmeja, joilla verkkojen eheys voidaan taata ennalta, sekä kehitettiin edelleen metabolomiikkatutkimuksessa syntyvän massaspektrometriadatan analysointia, erityisesti molekyylien fragmentaation ennustamista tandem-massaspektrometrissa.

Hiivan systeemibiologia - Yeast systems biology (YEASTSYS)

Ajankohta: 1/2006-7/2006
Tutkijat: Esa Pitkänen, Pekko Parikka, Markus Heinonen, Arto Åkerlund, Ari Rantanen, Esko Ukkonen
Rahoitus: Tekes

YEASTSYS on Helsingin yliopiston tietojenkäsittelytieteen laitoksen, Valtion teknillisen tutkimuskeskuksen sekä useiden yrityspartnereiden välinen yhteistyöprojekti. Tekes rahoittaa projektia osana NeoBio-tutkimusohjelmaa. YEASTSYS-projektissa tuotteistetaan tutkimusryhmässä aiemmin kehitettyjä laskennallisia solun metabolian mallinnusmenetelmiä www-sovelluksiksi.

Vuonna 2006 projektissa kehitettiin metaboliaverkkomallien visualisointiin ohjelma osaksi www-portaalia, joka toteutettiin aikaisemmassa projektissa. Portaali tarjoaa sovelluksiin yhtenäisen käyttöliittymän .

Genomisia työkaluja ja menetelmiä geenien ilmentymätekijöiden sitoumaspesifiteetin määrittämiseen - Advanced genomics instruments, technology and methods fordetermination of transcription factor binding specificities; applications for identification of genes predisposing to colorectal cancer (REGULATORY GENOMICS)

Ajankohta: 9/2004-9/2008
Tutkijat: Kimmo Palin, Cinzia Pizzi, Esko Ukkonen (lisäksi kuusi muuta ryhmää neljästä Euroopan maasta)
Rahoitus: EU

Ihmisen genomin sekvensointi ja geneettisen koodin selvittäminen ovat mahdollistaneet nopean edistymisen nisäkkäiden geenien tunnistamisessa. Kuitenkin geenien ilmentymisestä ja sen vaihtelua säätelevistä molekyylisistä mekanismeista tiedetään vain vähän. Tämä johtuu suurelta osalta puutteellisesta käsityksestä ”toisesta geneettisestä koodista” - ilmentymätekijöiden sitoumaspesifiteeteistä. Projektissa pyritään kehittämään uusia genomisia työkaluja ja menetelmiä ilmentymätekijöiden sitoumaspesifiteetin määrittämiseen. Näitä työkaluja tullaan käyttämään peräsuolen syöpään altistavien geenisäätelyyn vaikuttavien yhden nukleotidin monimuotoisuuksien (SNP) ja useille onkogeenisille ilmentymätekijöille yhteisten geenien tunnistamiseen.

Projektissa kehitetty Enhancer Element Locator (EEL) –ohjelmisto on saanut suurta kansainvälistä kiinnostusta. Ohjelman antamista säätelyelementtien ennusteista on etsitty kiinnostavia SNP:tä, joiden vaikutusta geenien ilmentymiseen tutkitaan laboratoriokokeilla.

Eurooppalainen genomiannotaatioverkosto - A European Network of Genome Annotation (BIOSAPIENS)

Ajankohta: 1/2004-12/2008
Tutkijat: Juha Kärkkäinen, Kimmo Palin, Esa Pitkänen, Pasi Rastas, Esko Ukkonen (yhteensä 21 instituuttia Euroopassa)
Rahoitus: EU

Eurooppalainen genomiannotaatioverkosto BIOSAPIENS pyrkii annotoimaan ihmisen genomista toiminnallisia paikkoja. Annotoitavat kohdat löydetään sekä kokeellisin että laskennallisin menetelmin. Tähän tutkimuksen huippuverkostoon kuuluu yhteensä 21 itsenäistä instituuttia eri Euroopan maista ja yhtenä verkoston tärkeimmistä tavoitteista on koordinoida eri laboratorioissa tehtävää tutkimusta, jotta Euroopan tutkimusresurssit saataisiin tehokkaaseen käyttöön. Verkosto järjestää pieniä työkokouksia sekä kursseja nimellä "Eurooppalainen Bioinformatiikkakoulu". Verkoston piirissä luodut genomiannotaatiot ovat julkisesti ja maksutta saatavilla hajautetun annotaatiojärjestelmän (DAS) kautta.

Projektissa kehitettiin tehokas suodatusmenetelmä merkkijonojen samankaltaisuushakuihin, mikä nopeuttaa huomattavasti hakuja suurista sekvenssitietokannoista. Projektissa myös ylläpidettiin laitokselle asennetun annotaatiopalvelimen tietoja. Laitoksen työpakettiin kuuluvat kansainväliset kumppanit tapasivat minikonferenssissa Englannissa marraskuussa.