Ihminen, data ja todennäköisyys
Nykyään rakastetaan infograafeja ja sitä, että tieto on nopeasti saatavilla. Harvoin kuitenkaan ehdimme kyseenalaistaa meille osoitettua tietoa juurikaan. Tärkein kysymys infograafien tekijöille onkin:
Kuinka luotettava datalähde on?
Onko tieto kerätty itse? Jos on, miten? Jos ei, kuka sen keräsi ja miten? Voitko luottaa, että se on tehty juuri niin? Jos kyse on reaaliaikaisesta datasta niin voiko joku muuttaa sitä tarkoituksella tai vahingossa. Heikoin lenkki on ihminen. Sen ymmärtäminen eri datalähteitä käytettäessä on ymmärrettävä. Nyt kyseenalaistetaan ihminen. (Linkki allaolevaan infograafiin löytyy täältä: https://ourworldindata.org/what-does-the-world-die-from)

Mielenkiintoista olisi miettiä, ehkä pidemmällekkin sitä mikä meitä ihmisiä kiinnostaa ja miksi. Noin joka kolmas ihminen maan päällä kuolee sydän- ja verisuonitauteihin. Puolet kaikkien kuolemien syistä on joko sydän- ja verisuonitaudit tai syöpä. Eli todennäköisin syy minkä vuoksi me poistumme täältä joskus. Harvoin meitä kuitenkaan kiinnostaa nuo aiheet niin, että niihin paneudumme (onneksi on myös niitä jotka todella paneutuvat!) ja selvitämme mitä voimme asian eteen tehdä. Kuitenkin luemme infograafin häntäpään asioista lehdistä lähes joka päivä: luonnonmullistukset, terrorismi ja konfliktit. Olemmeko siis kiinnostuneita niistä siksi, koska se on epätodennäköistä käydä kohdalle? Kuten lottovoitto!

Tein aiemmin hieman kökön, mutta toivottavasti havainnoillistavan graafin lottovoittojen todennäköisyyksistä aina poistaen seuraavaan ryhmään, edellisen ryhmän todennäköisimmän tuloksen. Eli "Ei voittoa poistettiin" jolloin "3 oikein", oli seuraavaksi todennäköisin jne. 7 oikein, oli työn ja tuskan takana saada edes esiin. Minkä takia lottoamme, kun tiedämme todennäköisyyksien olevan niin heikot? Onko kummassakaan (kuolema tai lotto esimerkissä) voitettavaa jos keskitymme toisiin ääripäihin.
Mitä jos keskittyisimme syömään vihanneksia ja ulkoilemaan jotta vältämme todennäköisimmän kuolinsyyn. Emmekö haluakin elää mahdollisimman pitkään? Mitä jos lopetamme lottoamisen ja säästämme rahamme johonkin muuhun. Vai onko se aina se mahdoton mikä meitä kiinnostaa?
Tarkoituksena oli kirjoittaa ja perehtyä data-analytiikan perusteisiin, mutta menikin vähän erilaiseksi pohdiskeluksi, ehkä ensi kerralla sitten!