Usko tai älä - päättelyä Bayesin mukaan

17.8.2010 Kirjoittanut Ari Hyytinen

Kuinka käsitystä jonkin tapahtuman todennäköisyydestä pitäisi päivittää, kun käyttöön saadaan uutta tietoa tapahtumasta? Bayesin sääntö on ehdolliseen todennäköisyyteen liittyvä matemaattinen ilmaisu, jonka voidaan tulkita kuvaavan sitä, miten käsityksiä voi ja tulisi päivittää.

Toisinaan Bayesin säännön soveltaminen tuottaa yllättäviäkin tuloksia.

Bayesin sääntö on puettavissa seuraavaan muotoon: Olkoon tapahtuman A todennäköisyys ehdolla B esimerkiksi P(A|B) ja tapahtuman B todennäköisyys ehdolla A vastaavasti P(B|A). Bayesin säännön mukaan P(B|A) = P(A|B)*P(B)/P(A), jossa todennäköisyyttä P(A) voidaan kutsua tapahtuman A:n priori-todennäköisyydeksi ja jossa P(B) on vastaava tapahtuman B:n todennäköisyys.

Tämä kaava ei varmaankaan sano useimmille mitään tai puhuttele ketään. Jos jaksoit kuitenkin lukea tähän asti, älä lopeta vielä. Seuraavat kaksi esimerkkiä nimittäin toivottavasti havainnollistavat kaavan merkitystä ja yllätyksellisyyttä:

Esimerkki #1: Sijoitusneuvot ja osakesijoittaminen

Kuvitellaan, että haluat rikastua nopeasti ja että olet valmis tekemään merkittävän pääosin velalla rahoitetun lyhytaikaisen sijoituksen osakemarkkinoille, jos saat mielestäsi riittävän luotettavan asiantuntijanäkemyksen siitä, että osakemarkkinat nousevat seuraavan päivän aikana nopeasti, esimerkiksi yli 10%.

Tällaiset nopeat kurssinousut ovat todella harvinaisia, mutta kuvitellaan tätä esimerkkilaskelmaa varten kuitenkin, että kysyt päivittäin valitsemaltasi osakemarkkina-asiantuntijalta nopeasta kurssinoususta ja että hän antaa sinulle aina yksinkertaisen vastauksen, eli joko ”osta” tai ”älä osta” -suosituksen. Oletetaan lisäksi, että valitsemasi asiantuntija on poikkeuksellisen hyvä: Hän antaa (väärän) ”osta” -suosituksen vain 10%:lle niistä päivistä, jolloin osakekurssit eivät nouse vähintään yllä mainitulla 10%:lla.

Valitsemasi asiantuntija on poikkeuksellinen myös siinä, että hän ei koskaan tee sitä virhettä, että hän neuvoo sinua olemaan ostamatta osakkeita (eli antaa ”älä osta” -suosituksen) tilanteessa, jossa osakemarkkinat nousevat seuraavan päivän aikana yli 10%.

Oletetaan vielä, että tyypillisenä vuonna on yksi sellainen päivä, jolloin osakemarkkinat nousevat yli 10%. Jos osakemarkkinat ovat auki kaikkina arkipäivinä, todennäköisyys sille, että satunnaisesti valittuna kaupankäyntipäivänä kurssit nousevat yli 10% on noin 1/260.

Mikä onkaan todennäköisyys, että kurssit todella nousevat yli 10%, kun asiantuntija antaa ”osta” –suosituksen? Tässä esimerkissä Bayesin sääntö kertoo, että P(kurssit nousevat |”osta”) = 1*(1/260)/[ 1*(1/260) +(1/10)*(259/260)] = 0.037 eli noin 4%.

Jätän lukijan harkittavaksi, onko 4% tässä yhteydessä pieni vai suuri luku. Vaikka yllä hahmoteltu esimerkki on täysin kuvitteellinen ja epärealistinen, se johtaa kuitenkin luontevasti kysymykseen, miten luotettavia osakesijoitusasiantuntijoiden (tai omien?!) näkemyksien pitäisikään olla, jotta niiden pohjalta kannattaisi luoda kuvitelmia nopeasta rikastumisesta osakemarkkinoilla.

Esimerkki #2: Silminnäkijätodistuksen painoarvo

Kuvitellaan, että kotikaupungissasi toimii kaksi erillistä rikollisjengiä, jotka pyrkivät erottautumaan selvästi asuillaan ja erityisesti tunnusväreillään. Kutsutaan näitä jengejä niiden tunnusvärien mukaan punaiseksi ja siniseksi. Poliisi on seurannassaan havainnut ja rekisteröinyt luotettavasti tiedon, että punainen jengi on selvästi suurempi jäsenmäärältään. Voimme olettaa tätä esimerkkilaskelmaa varten, että kaikista kaupungin jengiläisistä 90% kuuluu siihen. Loput kuuluvat siniseen jengiin.

Kaupungissa tapahtuu rikos, jolla on silminnäkijä. Silminnäkijä on hyvämaineinen ja tarkkakatseinen kaupunkilainen ja voidaan arvioida, että hän kykeni täydellä varmuudella tunnistamaan rikoksentekijän asun perusteella jengiläiseksi. Asun väritunnuksien osalta silminnäkijän havainto oli hieman epävarmempi, mutta hänen mukaansa asun väri oli sininen. Oletetaan tätä esimerkkilaskelmaa varten, että silminnäkijä on varsin luotettava myös tältä osin ja että hän tunnistaa oikean värin 80% todennäköisyydellä.

Kuinka paljon silminnäkijän todistukselle pitäisi antaa tässä tilanteessa painoa?

Monien ensireaktio on, että syyllistä tulisi etsiä sinisen jengin jäsenistöstä. Tämä ensireaktio kuitenkin unohtaa sen, että poliisin seurannan myötä saatua tietoa rikollisjengien suhteellisesta koosta voidaan pitää ”toisena todistuksena”, ja että tämän todistuksen mukaan suurin osa kaupungin rikollisenjengien jäsenistä kuuluu punaiseen jengiin.

Bayesin säännön avulla voidaan laskea todennäköisyys sille, että rikoksen tekijä kuuluu punaiseen jengiin, vaikka silminnäkijä antaa lausunnon, jonka mukaan tekijä kuului siniseen jengiin. Tässä esimerkissä P(tekijä punaisesta jengistä |silminnäkijähavainto sininen) = 0.2*0.9/[0.8*0.1+0.2*0.9] = 0.692 eli noin 69%.

Jätän myös tämän esimerkin osalta lukijan harkittavaksi, onko 69% tässä yhteydessä pieni vai suuri luku. Laskelma saa kuitenkin pohtimaan, että kuinka luotettavia silminnäkijähavaintojen pitäisi eri tilanteissa olla, jotta poliisin (tyypillisesti niukkoja) tutkintaresursseja kannattaisi kohdistaa pääosin niihin perustuen.

**********************************

Kirjoittaja on kauppatieteiden tohtori, joka on lukuvuoden 2010-2011 tutkimusvapaalla taloustieteen professuurista Jyväskylän yliopiston taloustieteiden tiedekunnasta.

Avainsanat: , , ,

Aihealueet: Mikro

2 kommenttia kirjoitukseen “Usko tai älä - päättelyä Bayesin mukaan”

  1. Tuomas kirjoitti:

    Niin, yhteinen nimittäjä näissä kai on, että tapahtuman todennäköisyys(osakenousu, sinisen jengiläisen osuus, harvinainen sairaus) on niin pajon pienempi kuin arvioinnin oikeellisuuden todennäköisyys, että lopputuloksena on paljon “harhalaukauksia”. Sekä osakkeiden nousun että lääkärin tapauksessa virhe syntyy virheellisistä positiivisista arvioista.

    Toisaalta ihmisen logiikka toimii paljon paremmin prosenttien sijaan konkreettisimmilla luvuilla. Jos sijoitusneuvoja antaa vuodessa noin 26 osta-suositusta (10% 259 päivästä) ja toisaalta tiedetään että kurssit nousevat yli 10% vain yhtenä päivänä, niin ei tarvitse olla matemaattinen guru todetakseen sijoitusneuvojan osta-liipaisimen olevan niin herkässä, ettei heppua kannata kuunnella.

    Eli ihmisen intuitio toimii paljon paremmin konkreettisilla luvuilla, jotka on kerätty ehkä vielä kokemuksen kautta, kuin prosenteilla. Saa miettimään sitäkin, että onko yritysjohtajillakaan kykyä arvioida riskejä (esim. finanssimaailmassa), kun riskit ilmaistaan prosenteissa ja muuten “ammattitermein”. Vastaavaa logiikkaa voinee soveltaa vaikka siihen, miten hyvin reittaajat osuvat oikeaan arvioidessaan luottokelpoisuutta, ja mikä vaikutus on näiden neuvojen kuuntelemisella.

  2. Jwalker kirjoitti:

    Hyvä kirjoitus!

    Talebin kirjassa “Fooled by randomness” on esimerkki samasta ideasta:

    Lääkäri tietää harvinaisen sairauden esiintyneisyyden populaatiossa ja tekee testin, joka antaa oikean tuloksen suuntaan tai toiseen esim 90% varmuudella - kuinka todennäköisesti positiivinen tulos on oikea?

    Kirjassa kerrotaan että suuri osa oikeista lääkäreistä, joilta tätä on kysytty vastaa 90%..