Laskuharjoitus 3 (1.4., 3.4)
Tehtäviin 1-4 sisältyy visualisointia.
Laskuharjoitustilaisuudessa on käytössä dataprojektori eli
"videotykki". Tulosta kuvat myös paperille. Kiinnitä kaikissa kuvissa
huomiota visuaalisen esityksen laatuun: kuvan täytyy palvella ilmiön
analysointia mahdollisimman hyvin! Muista myös kuvien otsikot, x- ja y-akselien
nimeämiset, sopivat pistetyypit ja -koot, viivanleveydet jne.
- Tarkastele tiedostossa Kunnat.txt
olevaa aineistoa.
- Piirrä histogrammi, jossa tarkastelet kuntien maa- ja
vesistöalan prosentuaalisia osuuksia koko pinta-alasta.
Arvioi histogrammin hyviä ja huonoja puolia kyseisessä tehtävässä;
millaisia muita mielekkäitä visualisointimahdollisuuksia keksit?
- Laske muuttujien pinta-ala ja asukasluku
(naiset + miehet) minimi, maksimi, keskiarvo, mediaani, keskihajonta ja
kvartiiliväli. Kuvaa muuttujat histogrammeilla.
Mitä nämä tunnusluvut ja visualisointi kertovat aineistosta?
-
Tarkastele samaa aineistoa kuin edellisessä tehtävässä.
- Piirrä sirontakuvio, jossa tarkastelet kuntien pinta-alan ja
asukasluvun suhdetta.
Vertaile maalaiskuntia ja kaupunkikuntia piirtämällä ne samaan
kuvaan erilaisilla pistetyypeillä.
- Laske korrelaatiokerroin näille muuttujille
koko aineistosta ja erikseen kaupungeille ja maalaiskunnille.
- Arvioi tulosta: mitä se kertoo muuttujien riippuvuuksista,
onko aineistossa poikkeavia arvoja, jotka vaikuttavat tulokseen jne.
- Keksi 20 havaintoparin (x,y) aineisto siten, että
attribuuttien välillä on funktionaalinen riippuvuus,
mutta korrelaatiokertoimen arvo on nolla (tai hyvin lähellä nollaa).
Piirrä kuva.
- Tarkastele tiedostoissa
EEG.t1.txt ja
EEG.t2.txt olevia kahta aikasarjaa (t1 ja t2).
Ne ovat koehenkilön päänahalle asetetun kahden elektrodin
samanaikaiset mittaukset yhden sekunnin aikana (2 x 256 arvoa).
Kyse on laajasta tutkimuksesta, jossa on tutkittu
aivosähkökäyrien (EEG) yhteyttä ihmisen geneettiseen alttiuteen alkoholismille.
- Esitä t1 ja t2 samassa kuvassa. Piirrä kaksi kuvaa,
joista ensimmäisessä koko ajanjakso, toisessa vain ensimmäinen 0.5
sekunnin ajanjakso.
- Autokorrelaatiolla tarkoitetaan saman aikasarjan
mittausten x ja x+d välistä korrelaatiota, missä
d on viive (lag). Laske aikasarjoille t1 ja t2 autokorrelaatio
arvoilla d=1 ja d=25.
- Laske aikasarjojen välinen korrelaatio (cross correlation), ts.
tarkastele pareja t1(i),t2(i), 0<=i<256.
(Tarkemmin autokorrelaatiosta ja aikasarjojen välisestä korrelaatiosta on kerrottu Cohenin kirjassa,
luvussa 2.5.3 Statistics for Time Series.)
- Toteuta ohjelma, joka testaa luennoilla esitetyn hypoteesin
shakkiohjelman A paremmuudesta. Ohjelmalle annetaan parametrina simuloitavien
turnausten lukumäärä, ja tuloksena se antaa arvoidun p-arvon tulokselle f=0.67.
Tehtävän 4 lähde: