Big Data, digitaalisuus – uusi valistuksen aika?

Tämän syksyn Helsingin yliopiston Studia Generalia -luentosarjassa on käsitelty teemaa Tiede ratkaisee. Ensimmäisen luennon "Mikä Big Data?" avasi digitaalisten aineistojen tutkimuksen professori Timo Honkela pohtimalla kysymystä "Mitä digimaailmassa tiedoista saadaan irti?"

— Digitaalisuus on teknologista tiedonkäsittelyä ja tehokasta tiedonsiirtoa, jossa koneet on otettu ihmisen avuksi tavoitteena edistää ihmisten ja yhteiskunnan hyvinvointia.

— Helsingin yliopiston keskustakampuksella tehdään paljon kansainvälisesti merkittävää ja noteerettua tutkimusta digiaineistojen saralla. Akateemikko Teuvo Kohosen jo 60-luvulla tutkimat koneoppimisen menetelmät ja neuroverkot ovat tänä päivänä saavuttaneet läpimurron, sanoi Honkela.

— Kohosen Grimmin satujen neuroverkko-analyysi vuodelta 1995 käytti samoja tekniikoita, joiden avulla hakukonejätti Google tarjoaa nykyisiä palvelujaan.

— Ja tilanne on koko ajan kiihtymässä, ei hidastumassa.

Honkela kertoi, että Helsingin yliopistossa on tutkittu digitaalisia ihmistieteitä intensiivisesti nyt kahden vuoden ajan. Lokakuun alussa avattiin Suomen Akatemian rahoittama HELDIG-yksikkö, jossa sata humanistia sekä yhteiskunta- ja tietojenkäsittelytieteilijää penkoo suuria aineistoja ja yrittää löytää ratkaisun esimerkiksi professori Arto Mustajoen esittämään ihmiskunnan suurimpaan ongelmaan eli siihen, että ihmiset eivät ymmärrä toisiaan.

— Koneet ja niiden tekoäly voidaan laittaa käymään läpi miljoonia dokumentteja ja tilastoja, ja oppimaan sitä kautta. Kone voi oppia paremmaksi kuin ihminen, vaikkapa autonajossa. Tulevaisuudessa koneet varmasti hoitavatkin sen homman, eikä ihminen ole enää ratissa, Honkela arveli.

— Olennaista koneoppimiselle ovat aineistot.

Kone oppii esimerkiksi lääketieteen numeerisia aineistoja ja kieltä. Kone voi oppia myös asioiden välisiä suhteita.

— Jos tieto on linkittynyt paikalliseen kieleen ja kulttuuriin, sen tulkita muuttuu erittäin haasteelliseksi. Tällöin, toisin kuin luonnontieteissä, sanat eivät merkitsekään kaikille keskustelijoille samoja asioita, vaan kulttuurinen konteksti vaikuttaa merkitykseen, analysoi Honkela.

— Keskustelun kautta sanojen tulkintaan voidaan kuitenkin kehittää menetelmiä, joilla voidaan tulkita niiden merkitystä. Puhutaan humanistisesta metaanalyysistä, jolla luodaan tulkintatilanteissa auttavia järjestelmiä.

— Avuksi voidaan ottaa Big Data ja maailman kaikki 129 miljoonaa kirjaa. Koneet pystyvät analysoimaan datan ja tarjoamaan helpotusta kulttuurien välisen keskustelun ymmärtämiseen. Humanistien ja yhteiskuntatieteilijöiden luomat tiedon palaset tuodaan meta-analyysillä uudella tavalla yhteen.

– Yhteinen ymmärrys voi kehittyä ennennäkemättömällä tavalla joten se, mitä tulee tapahtumaan 20-30 vuoden aikajaksolla on varmasti hätkähdyttävää, yhteisen ymmärryksen uudet ulottuvuudet, Honkela maalaili.

— Big Data ei tarjoa koko totuutta, vaan haltuunotettavat asiat voivat olla ristiriidassa keskenään. Käytetäänkö uusia mahdollisuuksia hyviin vai huonoihin ratkaisuihin on sitten kiinni poliitikoista ja muista johtajista. Mielestäni digitaaliset mahdollisuudet voidaan kuitenkin ymmärtää uutena valistuksen aikana.

— Parhaimmillaan tekoäly ja digihumanismi lisäävät ihmisten ymmärrystä eri yhteiskunnallisissa kysymyksissä ja voivat auttaa ratkomaan ihmiskunnan suuria kysymyksiä, kuten sodat, yhteiskunnalliset päätökset, ympäristökysymykset ja terveys, summasi Honkela lopuksi.Katri Pajusola

Painetussa lehdessä sivu 16