Tilastolaki läpi eduskunnassa

3.5.2013 Kirjoittanut Roope Uusitalo

Eduskunta hyväksyi eilen 2.5. lopullisesti Lain tilastolain muuttamisesta. Nyt tarvitaan enää presidentin allekirjoitus ja pitkällinen vääntö yksittäisiä henkilöitä koskevien tilastoaineistojen käytöstä tieteellisessä tutkimuksessa on ohi. Empiirisen tutkijan wapusta tuli melkein joulu.

Laki koskee tilastoviranomaisia, eli erityisesti Tilastokeskusta, ja muuttaa nykytilannetta kahdella oleellisella tavalla. Ensinnäkin tieteelliseen tutkimukseen saa jatkossa luovuttaa myös aineistoja, vaikka henkilöt voivat olla niistä välillisesti tunnistettavissa. Nimiä, osoitteita tai henkilötunnuksia Tilastokeskus ei edelleenkään saa tutkijoille luovuttaa, mutta vaikkapa 250 metrin tarkkuudella mitattuja karttakoordinaatteja ja näitä karttaruutuja koskevia tietoja saa tieteelliseen tutkimukseen luovutettavissa aineistoissa olla. Enää ei tarvitse murehtia siitäkään, olisiko aineistosta tunnistettavissa joku henkilö vaikkapa ammatin ja asuinpaikan perusteella. Uusi laki ei enää estä myöskään koko populaation kattavan aineiston käyttöä.

Toinen oleellinen muutos on tilastoviranomaisten oikeus rakentaa julkiseen käyttöön tarkoitettuja aineistoja. Erotuksena käyttöluvan alaisiin tieteelliseen tutkimukseen luovutettuihin aineistoihin tällaiset “public use”-datat pitää tosin suojata niin, ettei niistä voi yksittäisiä henkilöitä tai yksittäisiä yrityksiä tunnistaa. Käytännössä kuitenkin esimerkiksi Tilastokeskuksen isot otosaineistot, Työvoimatutkimus ja Tulonjakotilasto voitaisiin muokata sellaisiksi, että niitä voisi vapaasti käyttää vaikkapa gradumateriaalina. Vielä hienompi mahdollisuus olisi rakentaa Tilastokeskuksen linkitetystä työntekijä - työnantajadatasta “FLEEDistä” miniFLEED, jossa olisi mukana edustava joukko yrityksiä ja niiden työntekijöitä, jopa 20 vuoden ajalta. Laki ei tosin velvoita tilastoviranomaisia public use -datoja rakentamaan, antaa vain siihen mahdollisuuden. Hyvää tahtoa, neuvotteluja, ja ehkä vähän rahaakin tarvitaan siis edelleen.

Eduskunnassa laki ei ole suuria intohimoja aiheuttanut. Sen paremmin viime viikon ensimmäisessä täysistuntokäsittelyssä kun eilisessä toisessa käsittelyssäkään ei käytetty yhtään puheenvuoroa. Viime marraskuun lähetekeskustelussakin oli pyydetty vain yksi puheenvuoro ja sekin ilmeisesti vahingossa. Sen sijaan lakia viime vuonna valmistelleessa työryhmässä keskusteltiin pitkään ja hartaasti. Tulos ei ollut täydellinen - esimerkiksi julkiset verotiedot muuttuvat edelleen salaisiksi sillä hetkellä kun päätyvät Tilastokeskuksen palvelimelle - mutta kuitenkin tutkimuksen edellytysten kannalta hyvä. Omasta puolestani haluan kiittää kaikkia projektiin osallistuneita.

Vapauden lisäksi kasvaa myös vastuu. Käyttölupaehtoihin ja esimerkiksi velvoitteeseen aineistojen huolellisesta säilyttämisestä on syytä suhtautua vakavasti. Salassapitovelvollisuuden rikkominen on jopa rikoslaissa rangaistavaa.  Ja vielä suurempi vastuu on toteuttaa lain tarkoitus. Lainsäätäjä haluaa “edistää tilastotarkoituksia varten kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä”. Suomalaistutkijoilla on nyt näytön paikka.

Aihealueet: Lajittelematon

4 kommenttia kirjoitukseen “Tilastolaki läpi eduskunnassa”

  1. [...] The following is a translation of (parts of) a recent comment on the act published on “Akateeminen talousblogi” written by Roope Uusitalo (available at: http://blog.hse-econ.fi/?p=5411): [...]

  2. Jussi Heino kirjoitti:

    Roope Uusitalon kirjoitus Tilastolain hyväksymisestä eduskunnasta kuvaa osuvasti tutkijoiden odotuksia ja tunnelmia uudesta tilastolaista. Tilastokeskuksessa ollaan tyytyväisiä uuden lain tuomista mahdollisuuksista tilastotietojen entistä laajemmalle käytölle tutkimuksessa ja opetuksessa. On odotettavissa, että aineistojen tutkimuskäyttö tehostuu ja monipuolistuu uuden lain myötä. Samalla Tilastokeskuksen henkilöresursseja vapautuu aineistojen suojaamisesta valmiiden tutkimusaineistojen muodostamiseen ja kuvaamiseen. Voimavaroja suunnataan tutkijapalvelutoiminnan ja kansallisen etäkäytön kehittämiseen.

    Etäkäyttö on ensisijainen ja tietoturvallisempi kanava niiden aineistojen luovuttamiseen, joissa yksittäisten tilastoyksiköiden välillinen tunnistaminen on mahdollista. Käyttöluvan saaneen tutkijan vastuulla on huolehtia tietosuojasta aineistoa käsiteltäessä ja tuloksia julkistettaessa. Yksittäisiä henkilöitä tai yrityksiä ei saa olla tunnistettavissa tuloksista. Erikseen suunniteltavien, julkiseen käyttöön tarkoitettujen tiedostojen (Public Use Files, PUF) toivomme helpottavan erityisesti yhteiskuntaa koskevien tietojen käyttöä opetuksessa ja ne palvelisivat myös uusien tutkijoiden koulutusta yhteiskuntatieteellisillä aloilla. Näissä aineistoissa myös välillisen tunnistamisen mahdollisuus on estettävä kokonaan. Aineistojen käyttäjien asiantuntemus on Tilastokeskukselle erityisen arvokasta erilaisten tutkimusaineistojen kehittämisessä.

  3. Jussi kirjoitti:

    Tämän blogin kirjoittajille ja lukijoille on hyvä mainostaa, että Tilastokeskuksessa on johtajan virka avoinna, jonka määräysvallassa on myös tämän lain käytännön toteutuminen.

    Tilastotuotannon ylijohtaja
    Työavain 300-228-13

    https://haku.valtiolle.fi/JobsDescription.asp?ID=21812&LANGUAGE=&L=1&IE=2&LOCATION=&DURATION_ID=&TYPE_ID=&UNIT_ID=&JOBKEY=&LAN_ID=&FREE_TEXT=tilastokeskus&TYPE_LEVEL2=&AD_JOB_LEVEL=&FIELD_ID=

  4. Seppo Laaksonen kirjoitti:

    Upea asia jonka puolesta olin toki ollessani tilastokeskuksessakin mutta se ei ollut hyvä asia urani kannalta eli se ei edennyt siellä. Ymmärsin että tilastokeskus ei halunnut näin hyvää lakia. Public_Use -tiedostot ovat tietysti se mihin pitäisi nyt entistä enemmän panostaa. Se ei ole mahdollinen kaikkia mikrodatoja koskien mutta käytännössä kaikki poikkileikkausdatat joissa otospainot ovat riittävän isoja, voitaisiin antaa vapaaseen käyttöön. Silloin tutkijat voisivat aidosti kilpailla siitä mitä datoista saadaan irti ja hyöty lisääntyisi ratkaisevasti. European Social Surveyn malli on hyvä pohja tälle.