Datan analysoinnista, faktoista ja totuudesta puhutaan paljon. Datan määrä on lisääntynyt mielettömästi, mutta onko siitä saatu tieto kasvanut samalla tavalla? Tuoko digitalisaatio meille automaattisesti hyötyä ja viisautta kaiken lisääntyneen datan mukana ja opimmeko siitä jotain mitä emme jo tiedä? Onko datan analysointi ensimmäinen vai viimeinen ratkaisu ongelmiin?

Edelleen yksi aliarvostetuista ja yksinkertaisimmista keinoista datan käyttöön on datan visualisointi. Siis numeroiden muuttaminen kuviksi, jotta ymmärtäisimme ongelmaa tai tutkimaamme asiaa paremmin. Tämä ei vaadi suuria investointeja opiskeluun tai tilastotieteisiin vaan on lähes kenen tahansa opittavissa!

Mystinen data kuviksi
Kuva 1. Mystinen data kuviksi!

Valitsin sattumalta luettavaksi Hans Roslingin kirjan Faktojen maailma (2018). Kirja on hyvää ja nopeaa luettavaa ja oikeastaan harmittaa, että olin onnistunut tältä välttymään aikaisemmin. Kirjan nimi on kyllä äärettömän tylsä ja satuin tämän nappaamaan lähinnä kirkkaan oranssin kansitekstin ansiosta. Nimestään huolimatta, kyseessä on hyvä katsaus meidän itseämme fiksuina pitävien apinoiden huonoon kykyyn hahmottaa pitkiä kehityskulkuja ja maailmaa sellaisena kuin se oikeasti on. Häviämme simpansseille (satunnainen arvaaja), jos meidän pitää arvioida esimerkiksi äärimmäisen köyhyyden kehitystä maailmassa, kuten Rosling on tutkinut. Siis arvauksemme ovat huonompia kuin sattuma, eli systemaattisesti vääriä!

Rosling tuli kuuluisaksi taistelustaan faktojen puolesta lähes koko 2000-luvun ennen kuolemaansa vuonna 2017. Hänen hienoja animoituja kuplia ja kaavioita voi ihailla esimerkiksi osoitteesta https://www.gapminder.org/tools/#$state$time$value=1834;;&chart-type=bubbles ja lukuisissa TED-puheenvuoroissa.

Ei pidä hätääntyä ja luulla, että datan esittämiseen kuitenkaan tarvittaisiin ohjelmoijia ja koodaajia, sillä esimerkiksi Minitab hoitaa suurimman osan datan visualisoinnin tarpeista hyvin näppärästi. Tärkeintä on kuitenkin hyvät kysymykset, eikä liikkuvat animaatiot!

Roslingin kirja ei siis ole luettelo maailman faktoista, vaan faktaperustainen kuvaus ihmiskunnan hyvinvoinnin kehityksestä viimeisen noin 200:n vuoden ajalta. Lähtökohta on siis terveydessä tai oikeastaan ennenaikaisen kuolleisuuden vähenemissä. Emme ehkä osaa älylaitteidemme äärellä sitä arvostaa, mutta hyvinvoinnissa on muutaman sukupolven aikana tehty mielettömiä harppauksia, eikä vain ”kehittyneissä” talouksissa vaan aivan kaikkialla. Elämän edellytykset ovat todella parantuneet joka puolella, eikä koulussa opetettua ”kehittyvää” maailmaa oikeastaan edes enää ole olemassa läheskään siinä laajuudessa kuin kuvittelemme. Puhumme laadussa parannuksesta ja todellakin näyttää siltä, että maailma on muuttunut paremmaksi juuri ihmisten systemaattisen toiminnan seurauksena.

Kirjan tarinan ytimessä on oikeastaan se, että meillä ihmisillä on tapana pitää maailmaa kamalampana paikkana kuin se oikeastaan edes on. Ihmisten käsitys maailman tilasta on värittynyt saadun informaation ja erilaisten ajattelun ja havainnoinnin vinoumien takia. Tämä on tietenkin ongelmallista, kun pitää tehdä päätöksiä esimerkiksi siitä mihin rajallisia resursseja käytetään. Saatamme priorisoida merkityksetöntä ja väärää asiaa, jos emme pyri totuuteen faktojen ja datan avulla. Jos emme ymmärrä systeemin (kirjassa järjestelmä) käyttäytymistä ja päätösten seurauksia saatamme tehdä todella huonoja päätöksiä.

Huonojen päätösten välttämiseksi Rossling ehdottaa muutamaa myös prosessien analysoinnissa tai laadun johtamisessa käytettyjä keinoa datan esittämiseen ja tutkimiseen. Mielestäni ohjeet ovat erittäin oleellisia kaikille, jotka koittavat ymmärtää maailmaa ja käyttävät apunaan dataa, joko ensimmäisenä tai viimeisenä vaihtoehtona.

Vertailu – luvut ilman vertailukohtaa ovat vain lukuja

Roslingin perustelu vertailun käyttämiselle on aika yksinkertainen. Ihmisiä pelottavat isot luvut ja ilman vertailua on todella vaikea ymmärtää mistä on kyse. Mutta vertailu historiaan, referenssiin tai esimerkiksi asukasmäärään auttaa suhtauttamaan asioita. Ajatellaan vaikka, että koitetaan verrata taivaankappaleita toisiinsa. Auringon halkaisija, eli noin 1,4 miljoonaa kilometriä on täysin absurdi mitta, mutta 109 maata on jo mielekkäämpi tosin edelleen täysin älytön etäisyys. Automatkana 100 km/h tuntia nopeudella tämä olisi noin 1½ vuoden yhtämittainen ajomatka.

Aurinkokunnan kappaleiden ympärysmittoja pylväsdiagrammissa.
Kuva 2. Aurinkokunnan kappaleiden ympärysmittoja pylväsdiagrammissa. Kuva MINITAB 19

Numeroiden muuttaminen kuvaksi, edes yksinkertaiseksi pylväskuvaajaksi (kuva 1) auttaa suhteuttamaan lukuja ja dataa.

Histogrammi ja sen kaverit – paljasta hajonta

Yleensä kun asioita verrataan toisiinsa, verrataan jollain tavalla keskiarvoja toisiinsa. Keskiarvo on hieno luku, mutta samalla myös vaarallinen. Voi käydä kuten minkä tahansa kahden luvun vertailussa, eli tulkitsemme eroja, joita ei ole olemassa merkityksellisiksi tai emme ymmärrä dataryhmien olevan erilaisia ja tulkitsemme ne samanlaisiksi. Roslingin neuvo näyttää hajonta aina kun se on mahdollista on erinomainen! Tämä on tietenkin helppoa kunnollisella histogrammilla – yhdellä datan analysoinnin perusgraafilla.

Ihmisten elinajanodote vuosilta 1947 ja 2017 historgrammin muodossa.
Kuva 3. Ihmisten elinajanodote vuosilta 1947 ja 2017 historgrammin muodossa. Kuva MINITAB 19

Histogrammista on moneksi, yllä on kuvassa 2 esitetty erot maailman kaikkien arvioitujen maiden elinajanodotteen hajonnassa vuosina 1947 ja 2017. Pelkät luvut ja keskiarvojen ero 45 ja 72 vuotta ovat varmasti vaikuttavat, mutta kuva näyttää ilmiön vielä paremmin. Maailma on ainakin jollakin mittarilla parantunut. Hajontaa on, mutta kokonaisuus on siirtynyt oikealle ja pienempään kasaan. Histogrammin pylväiden korkeus kertoo kyseiseen dataryhmään kuuluvasta datapisteiden määrästä. Kuvassa on käyrinä myös jakauman normaalisovitus, joka lasketaan joukon hajonnasta ja keskiarvosta. Normaalisovitus tälle datalle ei ole ehkä ole kovin mieleinen, mutta auttaa hahmottamaan kokonaisuutta. Toinen vaihtoehtoinen kuvaus hajonnan esittämiselle voisi olla pistekuvaaja tai dotlplot alla (kuva 3).

Pistekuvaaja (dotplot) samaisesta elinajanodotteesta
Kuva 4. Pistekuvaaja (dotplot) samaisesta elinajanodotteesta. Kuva MINITAB 19

Dotplot on saman tyyppinen kuvaaja kuin histogrammi, mutta datapisteet on jaettu pienempii ryhmiin. Liiketoiminnan, palveluiden tai yleisesti prosessien ongelmia analysoitaessa näillä voidaan kuvata mitä tahansa hajontaa esimerkiksi ajassa, ominaisuudessa tai kysynnässä. Oikeastaan kaikessa missä pelkkä keskiarvon kanssa käyty keskustelu voi viedä harhaan. Vaihtoehtoisia tapoja on tietysti useita, yksi suosituimmista lienee boxplot, eli ”laatikkokuvaaja” joka kuvaa ryhmien tai joukkojen keskittymistä mediaanin (ei siis keskiarvon) ympärille. Kuvassa 4 (alla) on myös esitetty keskiarvot ympyrä-raasti -symbolilla.

Boxplot
Kuva 5. Boxplot. Kuva MINITAB 19

Tässä jutussa esitetyt datat ovat oikeita, mutta kaukana tavallisesta yritysmaailmasta tai organisaatioiden ongelmista. Mutta kyse ei ole datan tyypistä vaan ajattelusta! Vaikka meillä olisi dataa, päätöksiä tehdään edelleen enemmän taiteella ja tunnolla kuin faktoilla.

Datan kuvaamisen taito ei ole teknisesti vaikeaa. Kyse on enemmänkin ajattelutavasta ja oivaltavista kysymyksistä joita esitetään! Mieti siis onko data ensimmäinen vai viimeinen vaihtoehto ja miten dataa esitetään. Kriittinen ajattelu ja data ovat tärkeitä ja varmasti tulevat aina tärkeämmiksi, joten kokeilkaa rohkeasti faktaperusteista päätöksentekoa ja datan käyttöä!

Lähteet:

  1. Faktojen maailma (2018) Hans Rosling, Ola Rosling, Anna Rosling Rönnlund
  2. Minitab-ohjelma

Kommentoi artikkelia

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Tilaa uutiskirje

Liity postituslistalle ja saat uusimmat artikkelit suoraan sähköpostiisi.