Risto Nieminen
Ennustamisen vaikeudesta
Todennäköisyyksien, satunnaisilmiöiden ja tilastollisten
ennusteiden varhaiseen kehitykseen vaikutti
vahvasti kaksi matemaatikkoa ja filosofia. Ranskalainen
Blaise Pascal (1623-1662) katsoi maailmaa uhkapelurin
tavoin: jokainen arpakuution heitto on täysin
riippumaton edellisestä heitosta. Tapahtumaketjujen
todennäköisyyksien laskeminen on siinä tapauksessa
suoraviivaista puuhaa. Englantilainen Thomas
Bayes (1702-1761) otti mukaan tarkasteluun
satunnaisilmiöstä kertyvän kokemusperäisen tiedon:
tilastolliseen malliin liitetään a priori olettamus, joka
voi muuttua olosuhteiden mukana. Esimerkiksi hyvä
oletus huomisen säätä ennustettaessa on, että se on
samanlainen kuin tänään. Ylihuomisen säätä ennustettaessa
voidaan olettamus muuttaa sen mukaisesti,
mitä huomenna oikeasti tapahtuu.
Psykologisena olentona ihminen käyttäytyy varsin
bayesiläisittäin. Bayesiläiseen päättelyyn liittyy
kuitenkin suuri väärien yhteyksien olettamisen riski.
Tästä syystä klassinen tilastotiede ja erityisesti
luonnontieteet pitävät objektiivisempana Pascalin
maailmankuvaa. Asia ei kuitenkaan ole yksinkertainen.
Kun monimutkaisia ja satunnaisilmiöitä kuvaavia
järjestelmiä mallinnetaan, on miltei mahdoton
välttyä bayesiläiltä ennakko-olettamuksilta. Jos mallin
rakentaja ei tunnista tai tunnusta olettamuksia,
on suuri vaara johtua vääriin päätelmiin.
Ilmastomallit kuvaavat ilmakehän fysiikkaa ja
kemiaa, yhdistettynä valtameriin ja maamassoihin,
auringon säteilyn, vulkaanisten purkausten ja ihmisen
aiheuttamien päästöjen vaikutusten alaisena.
Mallit ovat erittäin monimutkaisia ja sisältävät suuren
määrän numeerisia parametrejä, jotka kuvaavat
esimerkiksi pilvimuodostelmien syntymistä tai sadepisaroiden
putoamisnopeutta. Ilmastomallia ajetaan
tietokoneessa tuhansia kertoja, eri parametrien arvoilla,
koska niitä ei tunneta tarkasti. Erilaiset parametrien
arvot tuottavat erilaisia ennusteita, joiden
oletetaan kasautuvan kaikkein todennäköisimpien
lopputulemien ympärille. Mallin tuottamaksi ennusteeksi
otetaan yleensä se, minkä ympärille ennusteet
ryvästyvät.
Etukäteen valittu parametrialue on kuitenkin tyypillinen
bayesiläinen olettamus, sillä se perustuu ilmaston
käyttäytymisestä saatuun empiiriseen kokemukseen.
Ei ole kuitenkaan samantekevää, miten yksittäiset
parametrit valitaan. Mallissa voi esiintyä esimerkiksi
lumikiteen viipymisaika pilvessä ja toisaalta
sen putoamisaika pilvestä maahan. Itse asiassa
nämä kuvaavat samaa asiaa, mutta ovat toistensa
käänteislukuja. Jos ensimmäistä ilmiötä kuvaavat parametrit
valitaan tasavälisesti (esim. 1, 2, 3, jne.), toista
kuvaavat parametrit (1, 0.5, 0.33, jne.) eivät vastaavasti
ole tasavälisiä. Jos ne sellaisiksi valittaisiin, mallien
ennusteet tuottaisivat erilaiset kasautumat.
Ilmastomallien sadoista parametreistä monet saattavat
olla tällöin tavoin toisistaan riippuvia. On syytä
kriittisesti kysyä, mitkä ovat tällaisten piilo-bayesiläisten
oletusten vaikutukset ennusteiden tilastollisiin
jakautumiin. Mitkä ennusteet ovat tilastollisesti kestäviä
ja mitkä vain parametriotantojen aiheuttamaa
kohinaa ? Tämän tarkoituksena ei ole asettaa ilmastomallien
luotettavuutta kyseenalaiseksi saati antaa
taustatukea ilmastoskeptikoille. Ilmaston muuttumisesta
kertynyt ja nopeasti kertyvä havaintoaineisto on
jo siirtänyt todistamisen taakan epäilijöille. Mutta
niin ilmaston kuin muidenkin monimutkaisten järjestelmien
mallintajien on syytä tunnistaa Bayes Pascalin
puvussa ja selvittää tunnistuksen seuraukset.
Risto Nieminen on akatemiaprofessori ja toimii fysiikan
professorina Teknillisessä korkeakoulussa
|