Seminaari: Suurten tietomassojen hallinta

58314104
3
Ohjelmistojärjestelmät
Syventävät opinnot
Vuosi Lukukausi Päivämäärä Periodi Kieli Vastuuhenkilö
2014 kevät 13.01-21.04. 3-4 Suomi Juha Puustjärvi

Luennot

Aika Huone Luennoija Päivämäärä
Ma 8-12 B119 Juha Puustjärvi 13.01.2014-17.02.2014
Ma 8-12 B119 Juha Puustjärvi 10.03.2014-21.04.2014

Yleistä

Seminaarin sisällöstä

Termillä “big data” tai “iso data” viitataan sellaisiin tietomassoihin, jotka ovat liian laajoja soveltuviksi perinteisten tietokantojen tallentamiksi, hallittaviksi tai analysoitaviksi.  Ne muodostuvat tyypillisesti blogien ja sähköpostien sisällöistä, erinäisten mittauslaitteiden tuloksista ja valokuvista. Niiden tallettamisen ja analysoinnin ovat mahdollistaneet tiedon tallentamisen ja laskennan jatkuvasti alentuneet kustannukset.   

Ison datan analysoinnilla pyritään löytämään liiketoiminnan kannalta hyödyllistä informaatiota, joka edelleen voidaan valjastaa yrityksen muiden tietojärjestelmien, kuten esim. asiakkuudenhallinnan, käyttöön. Perinteiset tiedonhallintaan erikoistuneet yritykset, kuten esim. Oracle ja IBM, ovatkin kehittäneet lukuisia sekä ison datan käsittelyyn että niiden integrointiin liittyviä ohjelmistoja.

Seminaarissa tarkastellaan ison datan käsittelyyn liittyvää problematiikkaa, menetelmiä, järjestelmiä ja niiden integrointia muihin tietojärjestelmiin. Mahdollisia esitelmäaiheita tai aihepiirejä ovat esim. seuraavat:

  • Defining Big Data
  • The 3V model
  • Web Logs
  • Organizing Big Data (Hadoop)
  • Analyzing Big Data
  • NoSQL databases
  • Key-value stores
  • Oracles’s Big Data Solution
  • IBM’s Bid data Solution
  • A Big Data Application
  • Mining Big Data
  • Big Data Cloud

Seminaarin toteuttamisesta

Seminaari kokoontuu maanantaisin klo 8-12. Seminaarin ensimmäinen tilaisuus on maanantaina 13.1.2014, jolloin on johdantoesitelmä sekä sovitaan esitelmäaikataulusta.  Kaksi viikkoa seminaarin alkamisen jälkeen (27.1.2014) osallistujat pitävät nk. lyhytesitelmät, jotka ovat kestoltaan n. 15 min. Näiden lyhytesitelmien taustalla on ajatus, että jo ennen varsinaisia esitelmiä pystytään hahmottamaan se kokonaiskuva, jonka seminaari tulee antamaan aihepiiristään. Lisäksi lyhytesitelmien avulla pyritään varmistamaan, että osallistujien esitelmätyöt ovat lähteneet hyvin käyntiin. Jokaisella kokoontumiskerralla (8-12) pyritään pitämään kaksi esitelmää. Esitelmät pyritään valitsemaa niin, että ne tukevat toisiaan. Seminaariin otetaan enintään 10 osallistujaa

Viimeksi päivitetty 27.1.2014

Esitelmäaikataulu