Suomeksi På svenska In English
Helsingin yliopisto Institutionen för datavetenskap
 

Årsberättelse 2006

Bioinformatik

Uppkomsten av smittor i mänskliga genom. Människans endogena retrovirus under hälsa och sjukdom – Infectious origins of the human genome. Human endogenous retroviruses in health and disease (MICMAN)

Tidsperiod: 1/2003 - 12/2006
Forskare: Merja Oja, Jaakko Peltonen, Samuel Kaski
Finansiering: Finlands Akademi

Projektet studerar växelverkan mellan virusparasiter, symbioter och människovärdar. Transposoner, av vilka de flesta är retrovirussekvenser, har trängt sig in a djur- och växtgenomer. Informationen som projektet utvinner är viktig både på lång sikt, för att förstå människans framtid, och på kort sikt för att kunna förstå sjukdomsmekanismer och utveckla möjliga genbehandlingsformer.

Projektet kartlägger och utvecklar bioinformatikmetoder med vilka man kan upptäcka retrovirussekvenser i människans genom och karakterisera dem. Rönen förenas med sekvensernas uttrycksdata. Med hjälp av styrda maskininlärningstekniker försöker projektet upptäcka virussekvenser och med hjälp av ostyrda dataanalys- och kunskapsutvinningstekniker försöker man karakterisera sekvensernas egenskaper. Projektet gör upp en databas över människogenomets retrotransposoninnehåll, och den förenas med data över transposonuttryck i olika vävnader. Man har funnit att människans endrogena retrovirus (en typ av mänsklig transposon) kan förekomma i både frisk och sjuk vävnad. Man vet dock inte vilka retrovirus som de facto aktiveras. För att lösa detta problem har projektgruppen utvecklat en statistisk blandningstäthetsmodell som baserar sig på dolda Markov-modeller och som kan utvinna aktivitetsnivåerna hos enskilda retrovirus (retrovirussekvenser) ur databaser som listar aktiva sekvenser. Gruppen har också empiriskt visat att en enkel och snabbare heuristisk metod kan estimera aktivitetsnivån hos retrovirus tillräckligt väl. Med denna snabba metod redde vi ut aktivitetsnivåerna hos retrovirus i 2450 personer; största delen av resultaten var tidigare okända. Resultaten visade att omkring 7 % av människans endogena retrovirus är aktiva, och att de aktiva individerna består av olika typer av endogena retrovirus. Testen med simulerade data visar också att den nya metoden estimerar aktiviteterna mycket noggrant.

 

Systemmodeller för ämnesomsättningsdynamik och reglering av genuttryck – Systemic models for metabolic dynamics and regulation of gene expression

Tidsperiod: 1/2004 - 4/2006
Forskare: Janne Nikkilä, Antti Ajanki, Janne Sinkkonen, Tapio Rinnet, Samuel Kaski
Finansiering: Modellerings- och simuleringsprogrammet vid Tekes

Projektet utvecklar nya beräkningsmetoder för modellering av genernas regleringsnätverk, tillämpar dem på jästens systembiologi, och integrerar dem med analysverktyg. Projektet modellerar särskilt stressresponsernas andel i experiment med genextraktionsmutationer samt jästens regleringsproteiners inverkan vid stressrespons.

Projektet har utvecklat en ny metod för att estimera förändringen av genreglering i olika förhållanden. Metoden baserar sig på Bayes-nätverk och en variation av dem, vilken har utvecklats i projektet. Den koncentrerar sig på hur avhängigheter förändras mellan olika situationer. Metoden har tillämpats på att uppskatta hur gener regleras under stressreaktioner. Den gör det också möjligt att kombinera genregleringsdata med expressionsdata över jästgener, och man har använt den för att forma nya hypoteser över geners regleringsväxelverkan under stress. Det är meningen att publicera mjukvaran under 2007.

Projektet har utvecklat en ny beräkningsmässigt mycket enkel metod som har tillämpats för att söka efter gemensamma drag i flera olika datasamlingar. Metoden har använts för att skilja mellan jästens stressrespons och andra funktioner hos jästen, vilket är viktigt t.ex. då man vill förstå hur genextraktionsexperiment påverkar ämnesomsättningen hos jäst. Metoden, som baserar sig på kanonisk korrelationsanalys, är allmänt brukbar och den kan även användas inom andra tillämpningsområden. Projektet har utvecklat en programvara som kommer att integreras med samarbetspartens programvaruplattform.

Inlärningsmetoder för bioinformatik - Learning methods for bioinformatics

Tidsperiod: 1/2005 - 12/2007
Forskare: Abhishek Tripathi, Jaakko Peltonen, Antti Ajanki, Samuel Kaski
Finansiering: Helsingfors universitet, forskningsanslag

Projektet utvecklar metoder för att kombinera olika biologiska mätningsdata och användning av bakgrundsdata vid analys av nya mätningsresultat. Inom biologiska forskningsfrågor kan man ofta endast göra mätningar från små provsamlingar, men med hjälp av mikrochipteknik kan man utvinna hundratusentals värden ur en enda sampel. Analyseringen av sådana data är utmanande och kräver biologisk bakgrundsinformation.

Projektet utvecklar nya beräkningsmetoder där man kan använda mätningar som samlats in förut som hjälp vid analysen, eller där man effektivt och automatiskt kan utvinna bakgrundsinformation från stora samlingar mätningsdata för användning med nya data. Tills vidare har projektet utvecklat lösningar på tre av deluppgifterna inom detta problemfält. En snabb, lineär förbehandlingsmetod för datafusion har utvecklats med vilken man kan lagra den gemensamma informationen i olika mätningsdata och förkasta dataspecifik information. Vidare har vi utvecklat en snabb metod för sökning av komponenter som beskriver dataklasser (diskriminativa komponenter). Den tredje metoden vi har utvecklat baserar sig på Bayes-nätverk. Den har utvecklats för analys av genregleringsnätverk och används för att upptäcka situationsbundna förändringar i regleringsväxelverkan.

 

Modellering av enzymers utvecklingshistoria - Modelling functional shifts in enzyme evolution (UR-ENZYMES)

Tidsperiod: 1/2006-12/2008
Forskare: Juho Rousu, Katja Astikainen, Esa Pitkänen, Liisa Holm (Biotekniska institutet)
Finansiering: Finlands Akademi

UR-ENZYMES är ett multivetenskapligt projekt som kombinerar maskininlärning med genomik med avsikt att klarlägga molekylers utvecklingshistoria. Projektet skapar nya algoritmer för utvinning av genomdata, komparativ genomik och rekonstruktion av metaboliska flöden. Projektets kärna består av strävan att representera enzymatiska reaktioner i sådan form att man kan spåra förändringen av enzymgeners funktioner under den biologiska evolutionens gång. År 2006 koncentrerade man sig inom projektet på att utveckla beskrivningar av enzymsekvenser och kemiska reaktioner samt att utnyttja dessa vid utvecklingen av maskininlärningsmetoder.

Systembiologisk analys av fysiologisk regulation - Experimental and computational analysis of physiological regulation at transcriptome, proteome and metabolome level (SYSFYS)

Tidsperiod: 1/2004-12/2007
Forskare: Juho Rousu, Esko Ukkonen, Ari Rantanen, Paula Jouhten, Esa Pitkänen
Finansiering: Finlands Akademi (SYSBIO-programmet)

Forskningskonsortiet SYSFYS, där institutionen för datavetenskap och institutet för bioteknik vid Helsingfors universitet samt VTT ingår, har som syfte att utveckla och tillämpa avancerade metoder för experiment och beräkning.

En av de centrala tilldragelserna år 2006 var Ari Rantanens avhandling som gjorde ett sammandrag av forskningsresultaten inom fluxestimeringar för metaboliflöden. Därtill studerade man inom projektet nya, effektiva rekonstruktionsalgoritmer för metabolinätverk, med vilka man kan garantera nätverkens integritet på förhand. Vidare utvecklade man analyseringen av masspektrometridata från metabolomikforskning, särskilt prognostiseringen av molekylfragmentering i tandemmasspektrometri.

Systembiologi för jäst - Yeast systems biology (YEASTSYS)

Period: 1/2006-7/2006
Forskare: Esa Pitkänen, Pekko Parikka, Markus Heinonen, Arto Åkerlund, Ari Rantanen, Esko Ukkonen
Finansiering: Tekes

YEASTSYS är ett samarbetsprojekt mellan institutionen för datavetenskap vid Helsingfors universitet, Statens tekniska forskningscentral samt ett antal företagsparter. Tekes finansierar projektet som en del av forskningsprogrammet NeoBio. YEASTSYS-projektet utvecklar en webbtillämpning av de modelleringsmetoder som projektet utvecklat tidigare för beräkning av cellmetabolism.

Under år 2006 utvecklade projektet ett program för visualisering av metabolinätverksmodeller som en del av en webbportal som har förverkligats av andra projekt. Portalen erbjuder ett gemensamt användargränssnitt för tillämpningarna.

Avancerade genomverktyg och metoder för att bestämma bindingsspecifitet hos expressionsfaktorer - Advanced genomics instruments,technology and methods for determination of transcription factor binding specificities; applications for identification of genes predisposing to colorectal cancer (REGULATORY GENOMICS)

Period: 9/2004-9/2008
Forskare: Kimmo Palin, Cinzia Pizzi, Esko Ukkonen (därtill sex övriga grupper från fyra europeiska länder)
Finansiering: EU

Sekvenseringen av människans genom och fastställandet av den genetiska koden har lett till snabba framsteg inom kartläggningen av däggdjursgener. Däremot vet man inte så mycket om genexpressioner och de molekylära mekanismer som reglerar deras variation. Detta beror långt på den ofullkomliga uppfattningen om 'den andra genetiska koden' – expressionsfaktorernas bindningsspecifiteter. Projektet har som mål att utveckla nya genomverktyg och –metoder för att bestämma expressionsfaktorernas bindningsspecifitet. Dessa verktyg kommer att användas för igenkänning av enbaspolymorfi (SNP) som påverkar genregleringen av gener som predisponerar för ändtarmscancer samt gener som är gemensamma för flera onkogenetiska expressionsfaktorer.

Projektet har utvecklat progamvaran Enhancer Element Locator (EEL) som har rönt stort intresse internationellt. Man har funnit intressanta SNP:er ur prognoserna för regleringselement som programmet ger. Inverkan av SNP:erna på genexpressioner studeras med hjälp av laboratorieförsök.

Ett europeiskt genomannotationsnätverk - A European Network of Genome Annotation (BIOSAPIENS)


Period: 1/2004-12/2008
Forskare: Juha Kärkkäinen, Kimmo Palin, Esa Pitkänen, Pasi Rastas, Esko Ukkonen (sammanlagt 21 institut i Europa)
Finansiering: EU

Det europeiska genomannotationsnätverket BIOSAPIENS har som syfte att annotera de funktionella områdena i människans genom. Områdena som skall annoteras upptäcks med hjälp av både experiment och beräkningsmetoder. Sammanlagt 21 oberoende institutioner från olika europeiska länder tillhör detta toppforskningsnätverk, och en av nätverkets viktigaste målsättningar är att koordinera forskningen vid olika laboratorier så att forskningsresurserna i Europa kunde användas så effektivt som möjligt. Nätverket arrangerar små arbetsmöten samt kurser under rubriken ”Europeisk bioinformatikskola”. Genomannotationerna som skapats inom nätverket är öppna för allmänheten och tillgängliga gratis via ett distribuerat annotationssystem (DAS).

Projektet utvecklade en effektiv filtreringsmetod för likhetssökning ur teckensträngar, vilket gör sökningar ur stora sekvensdatabaser avsevärt snabbare. Projektet upprätthöll också data i annotationsservern som installerats vid institutionen. De internationella samarbetspartners som ingår i institutionens arbetspaket möttes för en minikonferens i England i november.