Suomeksi På svenska In English
Helsingin yliopisto Institutionen för datavetenskap
 

Årsberättelse 2006

Complex Systems Computation Research Group) – CoSCo

Forskningsgruppen CoSCo studerar beräkningsfrågor som rör komplexa system, särskilt förutsägelser och frågor som rör modellval. Gruppens forskningsområden inbegriper stokastisk modellering och dataanalys, Bayes-nätverk och därmed besläktade probabilistiska modellgrupper som t.ex. finita blandningsmodeller, Bayesiska multinät och diskret huvudkomponentanalys, informationsteoretiska infallsvinklar på inferens (MDL) och stokastiska optimeringsalgoritmer som t.ex. simulerad aducering (simulated annealing) och genetiska algoritmer.

Forskningsarbetet har en fast ankring i grundforskning, och kombinerar datavetenskap, informationsteori och matematisk statistik. Därtill är gruppen starkt inriktad på tillämpning av forskningen. De teoretiska resultaten inom metodiken tillämpas mångvetenskapligt inom t.ex. socialvetenskaper, kriminologi, ekologi, medicin, historieforskning samt industriella tillämpningar.

På senare tid har personaliserad service på Internet, valmaskiner, teknik för nästa generations sökmotorer och positionsmedvetna serviceformer varit föremål för forskning inom gruppen. Forskningsgruppens medlemmar har en vid kunskapsprofil, från teoretisk forskning till utmärkta programmeringskunskaper. Som ett konkret exempel på det breda kunskapsunderlaget i gruppen kan man nämna den unika dataanalysservern B-Course ( http://b-course.hiit.fi ) som gruppen utvecklat och underhåller. Man har tillämpat de senaste forskningsresultaten inom sannolikhetsmodellering för servern. Under tre år har servern haft över 15 000 användare i hela världen, och resultaten av analystjänsten har utnyttjats till bl.a. utveckling av HIV-vaccin, analys av fågelsång och forskning i gendata.

År 2006 låg tyngdpunkten inom gruppen på forskning i sökteknologier för nästa generation http://cosco.hiit.fi/search för mera information). CoSCo-gruppen har som målsättning att bli en central operatör i utvecklingen av öppen källkod för detta område, och fungerar bl.a. som koordinator för ett brett EU-projekt på detta område (Alvis, se http://cosco.hiit.fi/search/alvis.html ). . Gruppens medlemmar grundade och organiserade ett sammanträde för att behandla ämnet, "International Workshop on Intelligent Information Access" (IIIA-2006), vilket bidrog till att ett antal toppnamn inom forskningen gästade Helsingfors i juli 2006 ( http://cosco.hiit.fi/search/IIIA2006/ ).

De mera teoretiska aktiviteterna hos gruppen representeras av servern www.mdl-research.org, som gruppen fortsatte att underhålla år 2006. Denna webbsajt strävar efter att samla de viktigaste forskningsresultaten om teorin om Minimum Description Length (MDL), som Jorma Rissanen utvecklat. Rissanen själv arbetar också aktivt med medlemmar i forskningsgruppen. Han tilldelades den prestigefyllda Kolmogorovmedaljen år 2006 för sitt arbete med MDL-teorin.

Kontaktperson: professor Petri Myllymäki

Webbsida: http://cosco.hiit.fi/

Projekt

Probabilistiska metoder inom dataanalys av mikrochips, PMMA
MDL-baserade metoder för avlägsning av störningar i bildsignaler, KUKOT
Scalable Probabilistic Methods for the Next Generation Search Engine (Prose)
Superpeer Semantic Search Engine (Alvis)
Search-Ina-Box (SIB)
Cognitively Inspired Visual Interfaces for Representing Multidimensional Information (CIVI)

Information om forskningsprojekt: http://www.cs.helsinki.fi/ar2006/forskning/

Publikationer

Roos, T. & Grünwald, P. & Myllymäki, P. & Tirri, H.: Generalization to Unseen Cases. Pp. 1129-1136 in Advances in Neural Information Processing Systems 18 (NIPS 05), edited by Y. Weiss, B.Schölkopf and J. Platt. MIT Press, Cambridge , MA , 2006.

Silander, T. & Myllymäki, P.: A Simple Approach for Finding the Globally Optimal Bayesian Network Structure. Pp. 445-452 in Proceedings of the 22nd Conference on Uncertainty in Artificial Intelligence (UAI-2006), edited by R. Dechter and T. Richardson . AUAI Press, 2006.

Buntine, W. & Jakulin, A.: Discrete Components Analysis. Pp. 1-33 in Subspace, Latent Structure and Feature Selection Techniques, edited by C. Saunders, M. Grobelnik, S. Gunn and J. Shawe-Taylor. Springer-Verlag 2006.

Roos, T. & Heikkilä, T. & Myllymäki, P.: A Compression-Based Method for Stemmatic Analysis. Pp. 805-806 in Proceedings of the 17th European Conference on Artificial Intelligence (ECAI 2006), edited by G. Brewka, S. Coradeschi, A. Perini and P. Traverso. IOS Press, 2006.

Jaeger, M. & Nielsen, J. & Silander, T.: Learning probabilistic decision graphs. International Journal of Approximate Reasoning, 42 (2006), 84-100.