2 Tilastoista

Oppimistehtävä 2 – harjoitustehtävät

Perusjoukko ja otanta

Perusjoukko eli populaatio on koko tutkittava ryhmä. Se voi olla esim. kaikki suomalaiset (5 400 000) tai kaikki Gradian opiskelijat.

Otanta on edustava otos tai näyte perusjoukosta. Sen perusteella tehdään päätelmä perusjoukosta. Sillä on aina virhemarginaali, jolla saatu tulos kuvaa perusjoukkoa.

Otanta voi olla esim. naisia ja miehiä, nuoria ja vanhoja suomalaisia tai järkevästi valittu osa Gradian opiskelijoista.

Mitta-asteikot

1 Luokittelu
Arvoilla ei ole yksikäsitteistä järjestystä.
Arvojen eroja ei voida laskea.

Esim. 30
tyttö, poika
oikein, väärin
kynä, kumi, viivain

2 Järjestys
Arvoilla on yksikäsitteinen järjestys.
Arvojen eroja ei voida laskea.

Esim. 31
vauva, lapsi, nuori, aikuinen
kuuma, lämmin, viileä, kylmä
harjoittelija, työntekijä, työnjohtaja

3 Välimatka
Arvojen erot voidaan laskea.
Arvojen suhteellista eroa ei voida laskea.

Esim. 32
vuosiluvut 2016, 2017, 2018
kouluarvosanat: 1-3, 1-5, 4-10
lämpötilan mittaaminen celsiusasteina (\text{\textcelsius})

4 Suhde
Arvoilla on absoluuttinen nollakohta.
Arvojen suhteellinen ero voidaan laskea.

Esim. 33
kappaleen massa  0\;\text{kg} \rightarrow
työntekijän vuositulot 0\;\text{\texteuro} \rightarrow
lämpötilan mittaaminen kelvineinä 0\;\text{K} \rightarrow

Taulukointi ja luokittelu

Kerättyä aineistoa on helpompi käsitellä, kun se luokitellaan ja taulukoidaan. On myös yksinkertaisempaa tutkia yhtä muuttujaa kerrallaan.

Frekvenssi (f) on havaintoarvon esiintymiskertojen lukumäärä. Suhteellinen frekvenssi (f\;\%) on havaintoarvon esiintymiskertojen prosenttiosuus.

Rendered by QuickLaTeX.com

Summafrekvenssi (sf) saadaan, kun lasketaan yhteen havaintoarvon ja sitä edeltävien arvojen esiintymiskertojen lukumäärät. Suhteellinen summafrekvenssi (sf\;\%) on summafrekvenssin prosenttiosuus.

Esim. 34

Lasketaan taulukkoon jokaisen arvosanan frekvenssi, suhteellinen frekvenssi, summafrekvenssi ja suhteellinen summafrekvenssi.

    \[ \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \quad \fcolorbox{red}{white}{3} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{3} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \]

Rendered by QuickLaTeX.com

Monesti on järkevää luokitella aineisto, jolloin (1) luokat valitaan tasavälisiksi, (2) luokkia muodostetaan yleensä 4-10, (3) jokaisella luokalla on luokkarajat (ylä- ja alaraja) ja (4) peräkkäisten luokkien ylä- ja alarajat ovat erisuuret.

Jos muuttujat on luokiteltu, on luokkaväli kahden peräkkäisen alarajan erotus. Luokkakeskus on luokan todellisen ala- ja ylärajan keskiarvo.

Esim. 35

Luokittele taulukkoon jokainen arvosana.

    \[ \fcolorbox{red}{white}{5} \enskip \fcolorbox{red}{white}{7} \enskip \fcolorbox{red}{white}{7} \enskip \fcolorbox{red}{white}{6} \enskip \fcolorbox{red}{white}{5} \enskip \fcolorbox{red}{white}{8} \enskip \fcolorbox{red}{white}{10} \enskip \fcolorbox{red}{white}{9} \enskip \fcolorbox{red}{white}{5} \enskip \fcolorbox{red}{white}{6} \enskip \fcolorbox{red}{white}{7} \enskip \fcolorbox{red}{white}{10} \enskip \fcolorbox{red}{white}{7} \enskip \fcolorbox{red}{white}{8} \enskip \fcolorbox{red}{white}{10} \]

Lasketaan taulukkoon frekvenssi, luokkaväli ja luokkakeskus.

Huomataan, että luokan 5-6 todellinen alaraja on 4,5 ja todellinen yläraja 6,5.

Rendered by QuickLaTeX.com

Kuvaajat

Tilastokuviot eli diagrammit havainnollistavat tilastoja.

Pylväskuvio eli pylväsdiagrammi voi olla pysty- tai vaakapylväitä. Se  koostuu erillisistä yhtä leveistä pylväistä.

Esim. 36

Mainonnassa kuluttajaa hämmennetään kuvaajilla.

Rendered by QuickLaTeX.com

Sama mainos ilman pystyakselin leikkausta!

Rendered by QuickLaTeX.com

Piirakkakuvio eli sektoridiagrammi eli ympyrädiagrammi havainnollistaa kokonaisuuden jakautumista osiin. Se alkaa ylhäältä keskeltä, ja sektorit piirretään myötäpäivään. Huonona puolena on se, että kyseinen diagrammi vaikeuttaa lähes yhtä suurten osuuksien erottamista toisistaan.

Esim. 37

Torikauppiaan päivämyynnin (100 %) jakautuminen.

Rendered by QuickLaTeX.com

Huomaa, että sektorin irrotus korostaa!

Hyvä tilastokuvio on selkeä ja yksinkertainen, joten visuaaliset kolmiulotteiset perspektiivikuvat vaikeuttavat hahmottamista.

Esim. 38

Laaditaan arvosanoista pylväskuvio ja sektoridiagrammi.

    \[ \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \quad \fcolorbox{red}{white}{3} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{3} \quad \fcolorbox{red}{white}{2} \quad \fcolorbox{red}{white}{1} \]

Lasketaan ympyrädiagrammia varten sektorien keskuskulmat.

Rendered by QuickLaTeX.com

Piirretään pylväskuvio ja sektoridiagrammi.

Rendered by QuickLaTeX.com

Rendered by QuickLaTeX.com

Histogrammi kuvaa muuttujan arvojen jakautumista tietyn valitun luokkajaon mukaisesti. Siksi sen pylväät ovat kiinni toisissaan ja siksi sen rajat ovat todellisten rajojen kohdalla.

Esim. 39

Pienen kylän ikäjakauma.

Rendered by QuickLaTeX.com

Viivadiagrammi kuvaa tutkittavan ominaisuuden kehitystä tietyn ajanjakson aikana. Siksi vaaka-akselilla on aina aika ja siksi pystyasteikko usein skaalataan edulliseksi.

Esim. 40

Yrityksen liikevoittojen kehitys vuosina 2012-2017.

Rendered by QuickLaTeX.com

Huomaa pystyakselin vaikutus kuvaajan tulkintaan!

Rendered by QuickLaTeX.com

Tilastollisia tunnuslukuja

Kun tilastossa on paljon informaatiota, tilastolliset tunnusluvut tiivistävät tietoa ja helpottavat päätelmien tekemistä.

Keskiluvut

Keskiluvut kuvaavat lukujoukon ”keskikohtaa”.

Lukujoukon aritmeettinen keskiarvo kuvaa sen keskimääräistä lukua. Se on lukujen summa jaettuna niiden lukumäärällä.

Rendered by QuickLaTeX.com

Kirjoitetaan keskiarvo, jos lukujen x_1, x_2,\ldots, x_n lukumäärä on n.

Rendered by QuickLaTeX.com

Esim. 41

Koulunumerot ovat 8, 9, 5, 6, 7, 7, 9 ja 7.

Lasketaan keskiarvo.

    \[ \overline{x} = \frac{8 + 9 + 5 + 6 + 7 + 7 + 9 + 7}{8} = \frac{58}{8} = 7,25 \]

Moodi (Mo) eli tyyppiarvo on se lukujoukon lukuarvo, jota on eniten. Se voi olla myös ne lukujoukon lukuarvot, joita on eniten.

Esim. 42

Koulunumerot ovat 8, 9, 5, 6, 7, 7, 9 ja 7.

Koulunumeroiden moodi on 7, koska niitä on 3 kappaletta eli eniten.

Rendered by QuickLaTeX.com

Mediaani (Md) on suuruusjärjestetyn lukujoukon keskimmäinen luku, jos lukuja on pariton lukumäärä. Se on  kahden keskimmäisen luvun keskiarvo, jos lukuja on parillinen lukumäärä. Mediaani jakaa lukujoukon kahteen yhtä suureen osaan.

Esim. 43

Koulunumerot ovat 8, 9, 5, 6, 7, 7, 9 ja 7.

Numerot ovat suuruusjärjestyksessä  5, 6, 7, 7, 7, 8, 9, 9.

Mediaani on kahden keskimmäisen luvun keskiarvo.

    \[ \bar{x} = \frac{7 + 7}{2} = 7 \]

Lukujoukko on symmetrinen, jos aritmeettinen keskiarvo ja mediaani on sama. Se on vino, jos tietyt joukon luvut eroavat paljon muista luvuista.

Lukujoukkoa kuvaavista keskiluvuista kertoo moodi yleisimmän, mediaani keskimmäisen, ja keskiarvo keskimääräisen havaintoarvon.

Hajontaluvut

Hajontaluvut kertovat lukujen sijainnin suhteessa keskilukuihin.

Jos lukujoukon hajonta on pieni, ovat kaikki luvut lähellä keskiarvoa. Jos se on suuri, on osa luvuista kaukana keskiarvosta.

Lukujoukon vaihteluväli on sen pienin ja suurin luku merkittynä hakasulkuihin. Pituudeltaan vaihteluväli on lukujoukon suurimman ja pienimmän luvun erotus.

Esim. 44

Koulunumerot ovat 8, 9, 5, 6, 7, 7, 9 ja 7.

Numeroiden vaihteluväli on [5,9].

Numeroiden vaihteluvälin pituus on 9 - 5 = 4.

Lukujoukon keskihajonta on mittaluku lukujen hajonnalle.

Rendered by QuickLaTeX.com

Jos keskihajonta on pieni, ovat lukujoukon lukuarvot lähellä keskiarvoa. Jos se on suuri, ovat lukujoukon lukuarvot kaukana keskiarvosta.

Esim. 45

Matematiikan numerot ovat 6, 9 ja 6.

Lasketaan keskiarvo.

    \[ \overline{x} = \frac{6 + 9 + 6}{3} = \frac{21}{3} = 7 \]

Moodi on luku 6, koska sitä on eniten 2 kpl.

Mediaani on luku 6, koska se on suuruusjärjestetyn lukujoukon 6, 6, 9 keskimmäinen luku.

Vaihteluväli on [6,9].

Vaihteluvälin pituus on 9 - 6 = 3.

Lasketaan keskihajonta.

    \begin{align*} s_3 &= \sqrt{\frac{(6-7)^2 + (9-7)^2 + (6-7)^2}{3}} \\ s_3 &= \sqrt{\frac{(6-7)^2 + (9-7)^2 + (6-7)^2}{3}} \\ s_3 &= \sqrt{\frac{(-1)^2 + (2)^2 + (-1)^2}{3}} \\ s_3 &= \sqrt{\frac{1 + 4 + 1}{3}} \\ s_3 &= \sqrt{2} \\ s_3 &\approx 1,4 \end{align*}