|
Kolumni
Risto Nieminen
Tiede 2.0
Informaatioteknologia, Internet erityisesti, on dramaattisesti
muuttanut tieteentekemisen muotoja.
Vaikka sähköposti on ollut käytössämme vain parikymmentä
vuotta ja Web viisitoista, on täysin mahdotonta
kuvitella vakavaa tietotyön tekemistä ilman
niitä.
Legendaarinen matemaatikko Paul Erdös vitsaili,
että matemaatikko on kone, joka muuttaa kahvin teoreemoiksi.
Tätä yleistäen tutkija on kone, joka muuttaa
dataa ymmärrykseksi. Internetin ansiosta tutkijan
käytettävissä oleva datan määrä kasvaa räjähdysmäisesti
kaikilla tieteenaloilla. Verkossa on satoja gigatavuja
biologien geenisekvenssejä, teratavuja tähtitieteen
kuva-arkistoja, on-line-sensorien tuottamaa
mittaustietoa ilmakehän tilasta, lingvistien kielikorpuksia
ja paljon, paljon muuta. Julkaisutoiminta on
nopeasti siirtynyt verkkoon, josta löytyy myös suunnaton
määrä datasta jalostettua (tai vähemmän jalostettua)
tietoa, Wikipedioista tieteentekijöiden blogikokoelmiin.
Tehokkaat hakukoneet selaavat miljardeja
verkkosivuja ja indeksoivat niiden sisältöä. Grid-teknologiaksi
kutsutut ohjelmistot ja käyttöliittymät
mahdollistavat verkon palvelujen entistäkin saumattomamman
saatavuuden. Käynnissä on murros, jonka
seurauksia emme vielä pysty näkemään mutta jonka
tarjoamat mahdollisuudet ja haasteet tutkimustyölle
ja tutkijakoulutukselle on syytä tunnistaa.
Termillä “Web 2.0” on ryhdytty kuvaamaan teknologioita,
sovelluksia ja liiketoimintamalleja, jotka ovat
tehneet mahdolliseksi sellaiset Internetin menestystarinat
kuin Google, Amazon, Skype, eBay, YouTube ja
iTunes. “Tiede 2.0” sopii yleisnimeksi niille uusille
tavoille tehdä tutkimusta, jotka hyödyntävät Internetiä,
sen datavarantoja ja palveluita, virtuaalisista observatorioista
proteiinitietokantoihin.
Tiede 2.0 on neljäs paradigma tutkimustyön historiassa.
Parituhatta vuotta sitten tiede perustui luonnosta
tehtyihin havaintoihin. Muutama sata vuotta
sitten mukaan tulivat ensin systemaattiset kokeet ja
sitten teoriat, jotka mahdollistivat tulosten systematisoinnin
ja ennusteet. Laskennallinen tiede ja tutkimus,
kolmas paradigma, on vakiinnuttanut asemansa
viime vuosikymmeninä. Se mahdollistaa monimutkaisten
järjestelmien, kuten maapallon ilmaston, numeerisen
simuloinnin. Neljäs paradigma on tutkimusmatkailu
verkon välityksellä datan valtameressä.
Dataa tuotetaan havainnoimalla, mittaamalla ja simuloimalla.
Paradigma Tiede 2.0 siis yhdistää kolme
muuta. Siitä käytetään myös muodikasta englanninkielistä
nimeä eScience.
Internetin antamat mahdollisuudet tuntuvat jo nyt
huikeilta, kun se antaa sormenpäihimme globaalin
kirjaston. Ihminen on kuitenkin auttamattoman hidas
Webin selailussa. Tarvitaan nopeita tietokoneohjelmia,
jotka pystyvät yhdistämään dataa monista lähteistä
ja tunnistamaan yhteyksiä, jotka ihmiseltä jäisivät
huomaamatta. Jo toteutuneita sovelluksia ovat
metabolisten polkujen päättely geeni- ja proteiinitietokantojen
avulla sekä kääpiötähtien tunnistaminen
digitaalisista taivaankartoituksista.
Tiede 2.0 tarvitsee uusia datan keräämisen ja automaattisen
analyysin välineitä sekä ennakkoluulotonta
koulutusta niiden käyttöön kaikilla tieteenaloilla.
Kysymys on uudenlaisesta infrastruktuurista, jonka
rakentamiseen, ylläpitoon ja luotettavuuteen on
meidän kaikkien annettava panoksemme.
Risto Nieminen
|