Suomalaisia seurataan tarkasti. Viranomaiset sekä sääntely- ja elinkeinopolitiikkaa toteuttavat julkiset organisaatiot keräävät suomalaisista yksilöistä ja yrityksistä huikean määrän yksityiskohtaista tietoa.
Tiesitkö, että esimerkiksi lääkereseptisi taltioituu tietokantaan? On myös tietoa siitä, kuka lääkkeet määräsi tai mitä lääkkeitä tämä henkilö on yleensä työuransa aikana määrännyt. Tiedämme myös kaikkien lääkkeiden hinnat, sinulle määrättyjen tai vaihtoehtojen. Sekä myös sinun ja lääkärisi tulot.
Tiedämme eurolleen paljonko Fortum ansaitsee joka tunti tuotantoyksiköittäin. Tai paljonko innovaatiopolitiikkaa toteuttava Tekes jakoi rahaa kullekin yritykselle. Tiedämme luonnollisesti, kuka sai poikkeusluvan rantarakentamiseen Hirvensalmella ja tämän henkilön mahdolliset kytkökset kunnalliseen päätöksentekoon.
Tiedämme paljon, mutta ymmärrämme vähän. Yksi syy on se, että Suomessa viranomaisilla tai niiden tehtäviä hoitavilla julkisilla organisaatioilla ei ole velvoitetta analysoida keräämäänsä tietoa. Byrokraatti tarvitsee toimiakseen ohjesäännön ja Suomessa ohjesääntöön ei kuulu omien toimien tehokkuuden tai vaikutusten arviointi. Siksi viranomaiset usein estävät myös ulkopuolisia hyödyntämästä aineistojaan.
Esimerkkejä löytyy joka suunnalta. Esimerkiksi Tekes ei järjestelmällisesti arvioi rahanjakonsa tehokkuutta. Tätä velvoitetta ei myöskään ole elinkeinopolitiikkaa toteuttavalla Finnveralla. Energiamarkkinavirasto seuraa sähkön jälleenmyyntimarkkinoita, mutta ei omaa resursseja analysoida keräämäänsä tietoa. Fingrid on se, joka tietää paljonko Fortum tuottaa ja ansaitsee kullakin yksiköllään, mutta sillä ei ole velvoitetta seurata markkinoita kilpailun näkökulmasta. Kilpailuvirastolla periaatteessa on tämä velvoite, mutta sillä ole riittäviä resursseja jatkuvaan markkinaseurantaan.
Tässä on yleispätevä ratkaisuehdotus julkishallinnon tiedon analysointiongelmaan: perustetaan Laboratorio Suomi. Laboratorio Suomi olisi maailman ensimmäinen tämän mittakaavan yhteiskuntatieteellinen tutkimuslaboratorio. Päätehtävänä olisi tuottaa tietoa suomalaisten yksilöiden ja yritysten käyttäytymisestä.
Laboratorion toimintaperiaate on yksinkertainen. Julkishallinto yksikertaisesti tarjoaa keräämänsä tiedon kansainvälisten tutkimusryhmien käyttöön. Hallinto ei maksa tutkimuksista, vaan keskittyy aineistojen tuottamiseen tavalla, joka tekee niistä ainutlaatuisia tutkimuskohteita, eli parhaiten palvelee tutkimusryhmien tarpeita, sekä suojaa yksilöiden anonymiteettiä kunnioittaen suomalaista tietosuojalainsäädäntöä.
Laboratorio ei yritä vaikuttaa tutkimusryhmien tutkimuskysymyksiin tai -menetelmiin. Toisin sanoen, se ei tilaa tutkimuksia, vaan ainoastaan tarjoaa “laboratorion”. Samalla julkishallinnon keskeiseksi “hyväksi hallintotavaksi” määritellään omien toimien, esimerkiksi sääntelyn, vaikutusten arviointi edesauttamalla oman hallinnonalan tutkimusta Laboratorio Suomessa.
Byrokraatista ehdotus tuntuu varmasti järjettömältä. Miksi kutsuisimme kansainvälisiä tutkimusryhmiä tekemään mitä haluavat ainutlaatuisilla suomalaisilla aineistoilla, sen sijaan että tilattaisiin selvityksiä tai aloitettaisiin Suomen akatemian tutkimusohjelmia ajankohtaisista polttavista kysymyksistä?
Juuri tässä on järjestely idea: huippututkijat kiinnostuvat Laboratorio Suomesta vain, jos saavat päättää itse mitä tutkitaan. Rahalla tätä kiinnostusta ei voi ostaa. Ainoastaan tutkijat itse tietävät, mitkä kysymykset tuottavat kansainvälisesti kiinnostavaa uutta tietoa.
Näyttää siltä, että järjestely ei maksa valtiolle paljon, mutta saako se haluamaansa tietoa? Kyllä saa. Huippututkimusta ei nimittäin tehdä perehtymättä huolellisesti talouteen ja instituutioihin. Tämän perehtymisen sivutuotteena syntyy paljon tietoa Suomesta yleensä, kiinnostavien tulosten lisäksi. Syntyisi myös Suomesta kiinnostuneiden tutkijoiden joukko, joka voisi tarvittaessa palvella valtiota konsultteina erityiskysymyksissä, esimerkiksi silloin kun halutaan selvittää sähkömarkkinoiden kilpailuongelmat.
Laboratorio Suomi nostaisi automaattisesti kotimaisen tutkimuksen tasoa, koska ulkomaiset huiput tarvitsevat suomalaisia yhteistyökumppaneita. Lisäksi kotimaisten tutkijoiden kiinnostus Suomea kohtaa kasvaa, kun Laboratorio Suomi niittää mainetta tutkimusrintamalla.
Väärinkäsitysten välttämiseksi: valtion omat tutkimuslaitokset tai Suomen akatemia eivät voi korvata Laboratorio Suomea. Näiden instituutioiden tavoitteena ei ole tehdä Suomesta kansainvälisesti kiinnostavaa tutkimuskohdetta.
Avainsanat: julkisen sektorin tehokkuus, tutkimus
Aihealueet: Julkinen talous
Todella kannatettava ajatus. Yhdysvalloissa Barack Obaman hallitus on ajanut juuri samanlaisia uudistuksia:
And Data for All: Why Obama’s Geeky New CIO Wants to Put All Gov’t Info Online
The Obama administration’s most radical idea may also be its geekiest: Make nearly every hidden government spreadsheet and buried statistic available online, all in one place. For anyone to see. Are you searching for a Food and Drug Administration report that used to be obtainable only through the Freedom of Information Act? Just a mouseclick away. Need National Institutes of Health studies and school testing scores? Click. Census data, nonclassified Defense Department specs, obscure Securities and Exchange Commission files, prison statistics? Click click. Click. Click.
Mielenkiintoinen ajatus.
Tosiaan ne yksityisyyden suoja kysymykset nousevat esiin. Eivät ne varmasti ylitsepääsemättömiä ole, mutta ei niitä voi sivuuttaa. Nimien poistaminen mikro-aineistosta ei auta, jos tiedot voidaan yhdistää muihin tietokantoihin. Jos voidaan yhdistää siihen reseptitietokantaan vaikkapa väestörekisterin osoitetietoihin, niin sitten ei tarvita kuin puhelinluettelo jotta tiedetään henkilön nimi. Tai jos tiedetään henkilön ikä ja työpaikka, niin keskiverto henkilö voidaan jo aika suurella varmuudella tunnistaa. Mikroaineistoa ei yksinkertaisesti voida laittaa esille. Jos niin tehdään, yksityisyydensuoja vaatimukset pakottavat lopettamaan sen aineiston keruun. Se pitää ensin anonymisoida kunnolla, käyttäen riittävän karkeita luokituksia kaikkien muuttujien kohdalla. Jos asuinpaikka teidetään vain postinumeron tarkkuudella, koulutus vain koulutusasteen tarkkuudella ja työpaikka vain karkean ammattiluokituksen tarkkuudella, yksittäisen henkilön identifioiminen on jo huomattavasti hankalampaa. Ongelmia olisi toki silti, aidosti kiinnostunut ihminen voisi varmaan aika hyvällä todennäköisyydellä selvittää kenestä on kyse. Jos luokitukset tehdään niin karkeiksi että jokaisessa luokitusten kombinaatiossa on vähintään 10 henkilöä niin voidaan jo puhua hyvin anonymisoidusta tiedosta. Tällainen aineisto ei tosin ole ollenkaan niin kiinnostava kun se tarkka mikrodata aineisto mitä viranomaisilla on. En tiedä olisiko näin karkeasti jaoteltu aineisto enää ollenkaan kiinnostavaa? Ainakaan halpaa ja yksinkertaista tällaisen tuottaminen ei olisi, mutta sitä kannattaa toki selvittää. Täytyy kuitenkin muistaa että verovaroin tuotettu tilastopalvelu maksaa meille kaikille. Vaikka tilastoihmisten mielestä Tilastokeskuksen budjetti ei koskaan voi olla liian suuri, on ihan perusteltuja syitä olla asiasta eri mieltä.
Todellista mikrodataa voidaan antaa tutkijoiden käyttöön erityisellä sopimuksella, mutta vain harkinnanvaraisesti ja mielellään valvotuissa olosuhteissa. Keskimääräiseen tutkijaan ei voi luottaa penninvertaa, eli aineistoja ei voida antaa kotikäyttöön kenelle vaan. Viimeistään vuosi sen jälkeen kun niin on tehty, aineisto on internetissä kun se tutkija keksi että se olisi aivan loistava harjoitusaineisto jotain data-analyysin harjoitustyötä varten. Tilastokeskuksella onkin jo tutkijalaboratorio jossa voi kai yritysten mikroaineistoja käsitellä. Tällaiseen palveluun voisi ehkä satsata enemmänkin, mutta ei sekään ilmaista ole, eikä se ole lähelläkään sitä utopiaa jota maalailit. En usko että Tilastokeskuksen tutkijalaboratorio koskaan houkuttelee massoittain ulkomaisia tutkijoita Suomeen.
Yksi väistämätön ongelma on, että pienen Suomen tilastolaitosten budjetit ovat väistämttä pieniä verrattuna suuriin maihin. Hyvät rekisteriaineistot kompensoivat toki, mutta esimerkiksi käyttöliittymien kehittelyssä pienuus on haitta. Aineiston esillepanon kustannukset ovat suurinpiirtein riippumattomia aineiston laajuudesta, eli Yhdysvalloissa, joissa tilastolaitoksilla on sata kertaa enemmän resursseja kuin Suomessa, on suurinpiirtein sata kertaa enemmän resursseja satsata aineiston esillepanoon. Sen takia sieltä löytyy vaikkapa hyvät reaaliaikaiset tietokannat kaikista oleellisista makromuuttujista, mutta Suomessa tällaisista voidaan oikeastaan vain unelmoida. Reaaliaikaisen tietokannan tuottaminen maksaa yhtä paljon Suomessa ja Yhdysvalloissa, mutta siellä se raha tulee sata kertaa suuremmasta budjetista. Se on oleellinen ero.
meillähän on tavallaan tuollainen datawarehouse viranomaistoimintana, nimmittäin Tilastokeskus. Valitettavasti se vain tuntuu olevan myös aliresursoitu sen itse tuottamien analyysien näkökulmasta, ja välillä on ymmärtääkseni ollut myös tutkijoiden vähän vaikea päästä käsiksi tilastokeskuksen hallinoimaan dataan. Ongelmana on vaan yhteiskuntatieteelle niin perinteinen eli tietosuoja… Tuskin missään tilanteessa nykyään tai tulevaisuudessa laillisesti pääsisin käsiksi Professori Liskin lääkeresepteihin, vaikka ansiotulot selviäsivätkin verotustiedoista.
Tilastokeskusta kehittämällä ja sen tiedonsaantioikeuksia vähän laajentamalla voisi hyvinkin kehittää tuollaisen Laboratorio Suomen.
Oikein mielenkiintoisia ajatuksia ja tietyllä tapaa sukua nykypäivän webissä tapahtuvalle evoluutiolle jossa uskalletaan jakaa asioita vapaasti ja avoimesti, ja ymmärretään niiden laajempi hyöty ryhmälle.
Uskoisin, että tästä olisi paljon hyötyä Suomelle, paljon enemmän kuin tökeröistä brändäysyrityksistä. Ensinnäkin jo tällaisen suunnittelusta varmasti uutisoitaisiin maailmalla ja Suomi voisi taas näyttää olevansa innovatiivinen maa.
Tässä tulee silti lopulta varmaankin vastaan se, että “Mitä ne meidän tiedoilla mahtaakaan tehdä?”. Tätä ajattelee enemmän vielä tietyn ikäiset ihmiset, kun taas hieman nuoremmat tuntuvat olevan paljon huolettomampia omien tietojensa suhteen.
Kysymys toisaalta kuuluukin kuinka paljon normaalilla, tavallisella ihmisellä on sellaista piiloteltavaa elämässään ettei joitain tietoja voisi jossain tällaisessa yleishyödyllisessä käyttää? Mitä sitten, että käyn usein tiistaisin ostoksilla Sokoksella töiden jälkeen? Voiko joku käyttää sitä minua vastaaan jotenkin? Ehkä, mutta tällaisia ajatuksia voi sitten pelätä koko elämänsä, kun siihen lähtee.