581264 Tutkimustiedonhallinnan peruskurssi, 3 ov, kevät 2003

Laskuharjoitus 4 (10.4)

HUOM: Tiistain ryhmä on peruttu vähäisen osallistumisen vuoksi. Tiistairyhmäläiset voivat osallistua torstain harjoituksiin.

  1. Testaa hypoteesi "kunnan maa-ala ja vesistöala korreloivat positiivisesti" aineistossa Kunnat.txt.
  2. Saadun p-arvon tarkkuus riippuu satunnaisiteraatioiden lukumäärästä.
  3. Edellisissä harjoituksissa oli seuraava tehtävä: Toteuta ohjelma, joka testaa luennoilla esitetyn hypoteesin shakkiohjelman A paremmuudesta. Ohjelmalle annetaan parametrina simuloitavien turnausten lukumäärä, ja tuloksena se antaa arvoidun p-arvon tulokselle f=10/15. Satunnaistamalla saatu p-arvon arvio on satunnaismuuttuja, jolla on oma otosjakaumansa. Toista edellinen tehtävä 1000 kertaa siten, että turnausten lukumäärä on K=1000 ja talleta p-arvot (varmista, että satunnaislukugeneraattorilla on joka kerralla eri siemenluku). Piirrä saadulle p-arvojakaumalle histogrammi. Mikä näyttää olevan p-arvon odotusarvo?
  4. Oletetaan, että halutaan satunnaistamalla tutkia ovatko otokset A ja B samasta jakaumasta tunnuslukuna keskiarvojen erotus. Otoksessa A on 3 lukua ja otoksessa B 8 lukua.
  5. Oletetaan, että edellisessä tehtävässä annettu joukko B on edustava otos koko populaatiosta.