Tekoäly on yksi vilkkaimmista keskustelunaiheista tällä hetkellä. Kiinnostus sitä kohtaan ei ole pelkästään kiinnostusta teknologiasta, sillä tekoälyn kehittymisellä on merkittäviä vaikutuksia työelämään, liike-elämään, koulutusjärjestelmään ja oikeastaan lähes kaikkiin yhteiskunnan osa-alueisiin. Mutta mistä tekoälyssä ja koneoppimisessa on kysymys?
Käsillä oleva kirja on “ei-tekninen, johtajille tarkoitettu perusjohdatus aiheeseen”. Se on kirjoitettu ytimekkäästi ja selkeästi. Liikkeelle lähdetään määritelmistä. Mitä siis ovat koneoppiminen ja tekoäly?
Koneoppiminen
Koneoppiminen on matemaattisten proseduurien (algoritmien) käyttämistä datan analysoinnissa. Tavoitteena on löytää käyttökelpoisia suhteita ja korrelaatioita datasta ja hyödyntää näitä sitten päättelyssä vastaavissa tilanteissa.
Kyse on samankaltaisesta prosessista kuin ihmisten oppimisen kohdalla. Teemme havaintoja ympäristöstämme ja käytämme sitten näitä kokemuksia hyväksemme uusissa tilanteissa. Mitä enemmän meillä on kokemuksia ja oppimista, sen parempi on kykymme tehdä päätöksiä.
Yksi keskeinen osa koneoppimista on ennustava analytiikka (predictive analytics). Siinä edellä kuvatulla tavalla hyödynnetään olemassa olevaa informaatiota, dataa, ennustamaan tapahtumia. Esimerkki ihmisen tekemästä vastaavasta toiminnasta on lääkäri, joka kartoittaa potilaan oireita, elintapoja ja muuta informaatiota päätelläkseen mikä sairaus potilaalla on.
Ennustemallit tuottavat pisteytyksen (score), joka kuvaa todennäköisyyttä tapahtumalle. Pisteytys kuvaa esimerkiksi sitä, miten ihmiset todennäköisesti tulevat käyttäytymään tulevaisuudessa.
Neljä tyypillistä esimerkkiä, missä ennustemallia voidaan käyttää ovat luottojen myöntäminen, markkinoinnin kohdentaminen, terveydenhuolto tai mediasisältöjen tarjoaminen.
Luotonhakijan profiilin ja ennustemallin perusteella voidaan päätellä, kuinka todennäköisesti hakija maksaa luottonsa takaisin. Luottopäätös voidaan sitten tehdä tämän informaation perusteella.
Toisaalta ennustemallia voidaan hyödyntää, kun arvioidaan ketkä ovat kiinnostuneita tuotteesta tai palvelusta. Ennustemalli voi perustua esimerkiksi ikään, sukupuoleen, koulutukseen, asuinpaikkakuntaan ja niin edelleen. Markkinointitoimenpiteitä voidaan suunnata ennustemallin tuottaman tuloksen avulla.
Terveydenhuollossa ennustemalli voi pohjata tietoon potilaan elintavoista, aikaisemmista sairauksista, sosioekonomisesta asemasta, iästä ja ennustaa näin riskiä saada esimerkiksi sydänkohtaus tai sairastua diabetekseen.
Mitä mediasisältöihin tulee, ennustemalli voi oppia käytetyistä sisällöistä ja “tykkäyksistä”, minkälaisesta sisällöstä mediankuluttaja pitää ja tarjota näin hänelle sisältöä.
Koneoppimisen perusperiaatteet tuntuvat siten melko yksinkertaisilta ja ymmärrettäviltä. Ennustava malli perustuu yksinkertaisimmillaan regressioanalyysiin, joka on monelle opinnoista tuttua asia.
Tekoäly
Mikä sitten on tekoäly (artificial intelligence)? Sille on monia määritelmiä, mutta kirjassa esitetyn perusmääritelmän mukaan:
Tekoäly (AI) on ihmisen analyysi- ja päätöksentekokyvyn replikointia.
Kyse on siis siitä, että edellä kuvatuissa ennustavan mallin tuottaman pisteytyksen perusteella tapahtuva päätös tapahtuisi koneen eikä ihmisen toimesta. Eli ennustemalli ei tuota pelkästään pisteytystä vaan luottopäätöksen, markkinointia, diagnoosin tai mediasisältöä.
Mitä parempi tekoäly-sovellus on, sen paremmin se pystyy “työskentelemään” suhteessa alan asiantuntijaan.
Perusvaiheet tekoälyn ja koneoppimisen hyödyntämisessä ovat:
- Datan syöttö. Data voi olla numeraalista, tekstiä, ääniä tai kuvia.
- Datan käsittely. Data muokataan muotoon, jossa sitä voidaan käsitellä.
- Ennustavat mallit. Mallit perustuvat koneoppimiseen ja aikaisemman datan hyödyntämiseen.
- Päätössäännöt. Säännöillä määritellään, mitä tapahtuu ennustavan mallin tuottaman informaation perusteella.
- Reaktio. Tässä määritellään, mitä konkreettista tapahtuu päätössääntöjen tuottaman lopputuloksen perusteella.
Tekoälyn hyödyntäminen muodostuu näiden vaiheiden ja toimenpiteiden yhdistelmästä.
Koneoppimista kannattaa hyödyntää, koska se on nopea, halpa, ei ole puolueellinen ja ennusteiden osumistarkkuus voidaan saada hyväksi.
Siksi algoritmit ovat korvaamassa ihmisiä monilla alueilla. Myös monissa sellaisissa tehtävissä, jotka vaativat aikaisemmin “valkokaulustyöntekijöitä” tekemään päätöksiä.
Tekoälyn tulo ole kuitenkaan pelkkää myrkkyä ihmisten tekemälle työlle. Algoritmi ei välttämättä kaikissa tilanteissa korvaa ihmistyötä vaan tukee sitä. On myös mahdollista, että algoritmien avulla päästään kiinni sellaisiin kysymyksiin, joita ei aikaisemmin ole voitu lähestyä.
Arviointia
Edellä kuvattu “rautalankamalli” koneoppimisesta avataan kirjassa sopivalla syvyystasolla. Eri vaiheista on kappaleen verran tekstiä, jossa havainnollistetaan esimerkiksi ennustavan mallin rakentamista tai päätöksentekosääntöjen laatimista.
Koneoppimisen perusasiat ovat olleet käytössä pitkään, sillä jo 1950-luvulla laskettiin pisteytyksiä luottopäätösten tueksi. Kehitys on tällä hetkellä kuitenkin nopeaa ja sitä tapahtuu kolmella alueella: algoritmit kehittyvät, dataa on enemmän tarjolla ja järjestelmät sekä sovellukset kehittyvät.
Laitteita (kännyköitä, tabletteja, tietokoneita), jotka tuottavat dataa on aikaisempaa enemmän. Sensorit integroituvat aikaisemmin “tyhmiin” laitteisiin. Laitteiden muisti- ja laskentakapasiteetti on myös aikaisempaa parempi. Merkittävä edistysaskel on myös se, että kommunikointi koneen kanssa ei ole enää pelkästään käskyjen kirjoittamista vaan se voi tapahtua puheentunnistusta hyödyntäen.
Siksi onkin paikallaan pohtia kehityksen seurauksia. Kirjassa pohditaan myös aihepiiriin liittyviä eettisiä ulottuvuuksia. Tekoälyn hyödyntäminen edellyttää valvontaan liittyviä toimenpiteitä sekä lainsäädännön kehittämistä. Hyvä esimerkki ajankohtaisesta aihepiiriin liittyvästä teemasta on Facebookin ja Cambridge Analytican tapaus.
Kaiken kaikkiaan kirja oli helposti omaksuttava ja ajattelua virittävä esitys aiheesta. Kirjan avulla on helppo ymmärtää, miksi koneoppiminen ja tekoäly muuttavat organisaatioiden, yritysten ja yhteiskunnan toimintaa niin monella tavalla. Itsekin osaan ajatella soveltamismahdollisuuksia omalla substanssialueellani hieman paremmin.
Lopuksi on hyvä todeta, että koneoppimisen ja tekoälyn perusteet esimerkiksi tämän kirjan tasolla tarkasteltuna eivät todellakaan ole monimutkaisia. Hieman tilastotiedettä opiskelleelle perusasiassa ei ole mitään uutta. Hyvä muistutus on myös se, että tekoäly on dataa ja matematiikkaa, eikä toistaiseksi “älykkyyttä” ihmisten lailla.
Steven Finlay: Artificial Intelligence and Machine Learning for Business. A no-nonsense guide to data driven technologies. Relativistic, United Kingdom. 2017.