Ennustamisen vaikeudesta

Todennäköisyyksien, satunnaisilmiöiden ja tilastollisten ennusteiden varhaiseen kehitykseen vaikutti vahvasti kaksi matemaatikkoa ja filosofia. Ranskalainen Blaise Pascal (1623-1662) katsoi maailmaa uhkapelurin tavoin: jokainen arpakuution heitto on täysin riippumaton edellisestä heitosta. Tapahtumaketjujen todennäköisyyksien laskeminen on siinä tapauksessa suoraviivaista puuhaa. Englantilainen Thomas Bayes (1702-1761) otti mukaan tarkasteluun satunnaisilmiöstä kertyvän kokemusperäisen tiedon: tilastolliseen malliin liitetään a priori olettamus, joka voi muuttua olosuhteiden mukana. Esimerkiksi hyvä oletus huomisen säätä ennustettaessa on, että se on samanlainen kuin tänään. Ylihuomisen säätä ennustettaessa voidaan olettamus muuttaa sen mukaisesti, mitä huomenna oikeasti tapahtuu.

Psykologisena olentona ihminen käyttäytyy varsin bayesiläisittäin. Bayesiläiseen päättelyyn liittyy kuitenkin suuri väärien yhteyksien olettamisen riski. Tästä syystä klassinen tilastotiede ja erityisesti luonnontieteet pitävät objektiivisempana Pascalin maailmankuvaa. Asia ei kuitenkaan ole yksinkertainen. Kun monimutkaisia ja satunnaisilmiöitä kuvaavia järjestelmiä mallinnetaan, on miltei mahdoton välttyä bayesiläiltä ennakko-olettamuksilta. Jos mallin rakentaja ei tunnista tai tunnusta olettamuksia, on suuri vaara johtua vääriin päätelmiin.

Ilmastomallit kuvaavat ilmakehän fysiikkaa ja kemiaa, yhdistettynä valtameriin ja maamassoihin, auringon säteilyn, vulkaanisten purkausten ja ihmisen aiheuttamien päästöjen vaikutusten alaisena. Mallit ovat erittäin monimutkaisia ja sisältävät suuren määrän numeerisia parametrejä, jotka kuvaavat esimerkiksi pilvimuodostelmien syntymistä tai sadepisaroiden putoamisnopeutta. Ilmastomallia ajetaan tietokoneessa tuhansia kertoja, eri parametrien arvoilla, koska niitä ei tunneta tarkasti. Erilaiset parametrien arvot tuottavat erilaisia ennusteita, joiden oletetaan kasautuvan kaikkein todennäköisimpien lopputulemien ympärille. Mallin tuottamaksi ennusteeksi otetaan yleensä se, minkä ympärille ennusteet ryvästyvät.

Etukäteen valittu parametrialue on kuitenkin tyypillinen bayesiläinen olettamus, sillä se perustuu ilmaston käyttäytymisestä saatuun empiiriseen kokemukseen. Ei ole kuitenkaan samantekevää, miten yksittäiset parametrit valitaan. Mallissa voi esiintyä esimerkiksi lumikiteen viipymisaika pilvessä ja toisaalta sen putoamisaika pilvestä maahan. Itse asiassa nämä kuvaavat samaa asiaa, mutta ovat toistensa käänteislukuja. Jos ensimmäistä ilmiötä kuvaavat parametrit valitaan tasavälisesti (esim. 1, 2, 3, jne.), toista kuvaavat parametrit (1, 0.5, 0.33, jne.) eivät vastaavasti ole tasavälisiä. Jos ne sellaisiksi valittaisiin, mallien ennusteet tuottaisivat erilaiset kasautumat.

Ilmastomallien sadoista parametreistä monet saattavat olla tällöin tavoin toisistaan riippuvia. On syytä kriittisesti kysyä, mitkä ovat tällaisten piilo-bayesiläisten oletusten vaikutukset ennusteiden tilastollisiin jakautumiin. Mitkä ennusteet ovat tilastollisesti kestäviä ja mitkä vain parametriotantojen aiheuttamaa kohinaa ? Tämän tarkoituksena ei ole asettaa ilmastomallien luotettavuutta kyseenalaiseksi saati antaa taustatukea ilmastoskeptikoille. Ilmaston muuttumisesta kertynyt ja nopeasti kertyvä havaintoaineisto on jo siirtänyt todistamisen taakan epäilijöille. Mutta niin ilmaston kuin muidenkin monimutkaisten järjestelmien mallintajien on syytä tunnistaa Bayes Pascalin puvussa ja selvittää tunnistuksen seuraukset.

Risto Nieminen on akatemiaprofessori ja toimii fysiikan professorina Teknillisessä korkeakoulussa

ACATIIMI 2/06

tulosta | sulje ikkuna