Oma vika

7.2.2014 Kirjoittanut Roope Uusitalo

Kun tutkimusta tarpeeksi pitkään harrastaa, sattuu matkan varrella mokiakin. Huonoja päätöksiä ja vääriä valintoja tekee varmaan meistä jokainen. Harkitsemattomia kommenttejakin tulee joskus melkein kaikilta, jotka vastaavat puhelimeen toimittajien soittaessa. Tutkijan kannalta kiusallisimpia ovat kuitenkin ne, joista jää paperille jälki, jota myöhemmät tutkijapolvet pääsevät irvimään ja vielä pahempia ne, joita kukaan ei huomaa mutta joita joku myöhemmin johonkin tarkoitukseen käyttää.

Itse olen valmis tunnustamaan kolme mokaa, jotka ovat vuosien jälkeenkin jääneet kiusaamaan. Jääkööt näistä kaksi myöhempiä itseruoskintatarpeita varten odottamaan, mutta avaudunpa tässä siitä ensimmäisestä, joka samalla taitaa olla kestävimpiä kontribuutioitani taloustieteen ulkopuolisiin yhteiskuntatieteisiin.

Olin yliopistosta valmistumisen aikaan tutkimusapulaisena Koulutussosiologian tutkimuskeskuksessa (RUSE) Turussa. Päätyönäni oli tehdä kustannus-hyötyanalyysiä korkeakoulutuksesta, mutta samalla avustin RUSEn sosiologeja ja kasvatustieteilijöitä tilastollisissa analyyseissä.

RUSEn professorit Osmo Kivinen ja Risto Rinne olivat jo pitkään tutkineet koulutuksen periytyvyyttä vertaamalla eri tasoisten tutkinnon suorittaneiden vanhempien taustoja. Tulokset olivat selkeitä, yliopistotutkinnon suorittaneiden lapset olivat moninkertaisesti yliedustettuna yliopisto-opiskelijoiden ja yliopistoista valmistuneiden joukossa ja aliedustettuna ammatillisessa koulutuksessa. Koulutus siis periytyy tai kuten Kivinen & Rinne sen ilmaisivat “Kotitausta viitoittaa koulutien”.

Ongelmana oli, miten mitata muutoksia koulutusmahdollisuuksien tasa-arvossa. Kun duunari-isien lapsista opiskeli 20-24 -vuotiaana yliopistossa vuonna 1985 6,4% ja vuonna 1990 7,5% ja samat luvut korkeakoulutettujen isien lapsille olivat 45,2% ja 47,8% niin, oliko mahdollisuuksien tasa-arvo kasvanut vai laskenut.

Näppärä tilastotieteen laudaturkurssit suorittanut tutkimusapulainen ehdotti, että lasketaan logit-malleja. Niinpä sitten nuo prosentit muutettiin oddseiksi eli vedonlyöntisuhteiksi. Korkeakoulutettujen isien jälkeläisten oddseiksi päätyä korkeakouluun saatiin vuonna 1990 (0,478)/(1-0,478) = 0,92 ja duunari-isien jälkeläisten oddseiksi (0,075)/(1-0,075) = 0,08. Oddseja verrattiin toisiinsa laskemalla mikrodatasta logit-malleja, joissa korkeakouluun pääsyä selitettiin vanhempien taustalla, ja raportoimalla niiden tuottamia odds ratioita, vaikka ne tietysti olisi saanut noista luvuista suoraankin (0,92/0,08 = 11,2). Kun oddsit kääntyivät suomeksi huonosti, artikkelissa sitten kirjoitettiin, että akateemisen isän jälkeläisen todennäköisyys päätyä korkeakouluun oli 11-kertainen kouluttamattoman isän jälkeläiseen verrattuna. Kun sama odds-ratio viisi vuotta aiemmin oli ollut 12, oli siis mahdollisuuksien tasa-arvo kasvanut. (Kivinen & Rinne 1995, s. 91)

Oikeampi ratkaisu tietenkin olisi ollut raportoida korkeakouluopiskelijoiden osuus eri ryhmissä ja kertoa että muutoksen suunta riippuu siitä, halutaanko mitata suhteellisia vai absoluuttisia eroja. Toki olisi voinut myös kertoa että odds-ratiolla mitattuna tasa-arvo on lisääntynyt, mutta että tämä on vain yksi mahdollinen tapa muutoksen mittaamiseen. Enkä minä niitä oddseja tietenkään itse keksinyt, ristiintaulukoitua dataa oli odds-ratioitten avulla analyisoitu melkein sata vuotta. Silti paljon helpommin lukijoille olisivat avautuneet alkuperäiset prosenttiluvut. Ja suurin rikos oli sotkea oddsit ja todennäköisyydet.

Osmo Kivinen ja Risto Rinne saivat lehtien palstoilla aiheellisesti huutia jakolaskutaidon puutteestaan, eikä siinä paljon auttanut, että tutkimusapulainen oli raporttiin kirjoittanut siistin alaviitteen, jossa paljastettiin, etteivät “todennäköisyydet” oikeastaan olleetkaan todennäköisyyksiä. Raportin alkusanoissa kiitetylle tutkimusapulaiselle osasi soittaa vain silloin Helsingin yliopiston kaupunkitaloustieteen professorina ollut Heikki Loikkanen, jonka ripitystä yksinkertaisten asioiden sotkemisesta ja logit-mallin tarpeettomuudesta yhden selittävän muuttujan malleissa kuuntelin puhelimessa korvat punaisena.

Pieni kritiikki vedonlyöntisuhteiden ja todennäköisyyksien sekoittamisesta olisi varsin ollut harmitonta, ellei tulkinta olisi jäänyt elämään. Sosiologit kävivät vielä 2000-luvulla mm. Acta Sosiologicassa ja Januksessa kummallista debattia koulutusmahdollisuuksien tasa-arvon mittaamistavasta. Aivan kuin jakaumien muutosta voisi tyhjentävästi kuvata yhdellä numerolla. Käsitteitä ei toki enää sotkettu. Lopulta Osmo Kivisen, Juha Hedmanin ja Päivi Kaipaisen Janukseen (2008/2) kirjoittama artikkeli, jossa raportoitiin sekä lukumääriä, osallistumisprosentteja että oddseja 1946 - 1976 syntyneille kohorteille tavalla, jossa laskentatavasta ei jäänyt mitään epäselvää, taisi pistää jonkinlaisen pisteen tälle keskustelulle. Silti vasta ilmestyneessä Suomen kasvatuksen ja koulutuksen historiassa Risto Rinne itse ja Sari Pekkala Kerr kirjoittavat edelleen, että akateemisen isän jälkeläisten todennäköisyys valikoitua korkeakouluun oli vuonna 1990 11-kertainen perus- tai kansakoulun koulun suorittaneen isän jälkeläisiin verrattuna (Kerr & Rinne 2012, s. 330). OK, tuossakin artikkelissa on alaviite, jossa “todennäköisyys” on saanut ympärilleen lainausmerkit ja jossa kerrotaan lukujen perustuvan logistiseen regressiomalliin, mutta moniko artikkelin lukijoista siihen jaksaa perehtyä saatika ymmärtää mistä on kyse.

Vielä kiusallisempaa on, että huolellisesti tehdyistä, pitkiä aikasarjoja koulutuksen periytyvyydestä raportoivista artikkeleista, joihin mielellään itsekin viittaisi, löytyy pelkkiä odds-ratioita. Esimerkiksi Osmo Kivinen, Juha Hedman ja Päivi Kaipainen laskevat Yhteiskuntapolitiikka-lehdessä 2012(5), että odds-ratiolla mitattuna koulutusmahdollisuuksien tasa-arvo akateemisten ja ei-akateemisten kotien välillä on kasvanut vuodesta 1970 vuoteen 2005 asti, mutta ehkä kääntynyt sen jälkeen lievästi laskuun. Mistään ei löydy kummankaan ryhmän todennäköisyyksiä päätyä korkeakouluun tai lukumääriä, joista nuo voisi itse laskea. Edes tutkijat itse eivät odds-debattiin kyllästyneinä suostu alkuperäisiä lukuja kertomaan. Jää siis kokonaan arvailujen varaan johtuuko tasa-arvokehitys vanhempien koulutustason muutoksista, korkeakoulujärjestelmän laajenemisesta vai työläistaustalla korkeakouluun pääsyn vaikeutumisesta. Koulutuspolitiikan kannalta näillä luulisi olevan väliä. Ilman kohta parinkymmenen vuoden takaisia odds-innovaatioitani vastauskin voisi olla pykälää lähempänä.

Sari Pekkala Kerr ja Risto Rinne (2012): Koulutus ja väestön taloudellinen ja sosiaalinen liikkuvuus 1900-luvulla. Pauli Kettunen ja Hannu Simola (toim. ): Tiedon ja osaamisen Suomi. Kasvatus ja koulutus Suomessa 1960-luvulta 2000-luvulle. SKS:n toimituksia 1266:3.

Osmo Kivinen ja Risto Rinne (1995): Koulutuksen periytyvyys. Nuorten koulutus ja tasa-arvo Suomessa. SVT Koulutus 1995:4, Tilastokeskus.

Osmo Kivinen, Juha Hedman ja Päivi Kaipainen (2008): Miten koulutusmahdollisuuksien tasa-arvoa tutkitaan? Kommentti Ritan, Tötön ja Alastalon vastineeseen Jani Erolalle ja Pekka Räsäselle. Janus 16 (2008): 2, 185-190.

Osmo Kivinen & Juha Hedman & Päivi Kaipainen (2012): Koulutusmahdollisuuksien yhdenvertaisuus Suomessa. Eriarvoisuuden uudet ja vanhat muodot, Yhteiskuntapolitiikka 77 (2012):5

Aihealueet: Koulutus, Kummalliset

2 kommenttia kirjoitukseen “Oma vika”

  1. Austrian kirjoitti:

    Klaus, tuo suure muistuttaa kovasti uskottavuusosamäärän jonkinlaista muunnosta. Mikähän sen jakauma on?

    Bayes factor - suure kuulostaa vielä mielenkiintoisemmalta, useimmitenhan ei puhuta hypoteesin todennäköisyydestä olla totta tai ei-totta suhteessa johonkin perusuran hypoteesiin.

  2. Klaus Kultti kirjoitti:

    Kannattaisikohan laittaa enemmän voimavaroja tasa-arvon käsitteen pohtimiseen. Todennäköisyyksien ja oddsien ja evidenssin ja vastaavien käsitteiden kvantifiointiin on jo olemassa hyvä metodologia; pitää vain irtautua ortodoksitilastotieteestä. Jo pitkään on tiedetty, että kovin isojen ja kovin pienien kvantiteettien ymmärtäminen on helpointa desibelien avulla

    http://www.johndcook.com/blog/2008/03/11/how-loud-is-the-evidence/