Kirja Big Datasta

bigdata

Digitalisaation, sensoriteknologian, esineiden internetin, tallennuskapasiteetin kehittymisen ja laskentatehon lisääntymisen vuoksi datan määrä kasvaa eksponentiaalisesti. Lähes kaikesta toiminnasta digitaalisessa yhteiskunnassa jää jälki, joka kerryttää dataa, jota kutsutaan Big Dataksi. Tätä dataa analysoimalla ja hyödyntämällä eri toimijat ja yhteiskunta hyötyvät. Tässä käsillä olevassa kirjassa pohditaan Big Datan hyödyntämistä erityisesti liiketoiminnassa.

Kirjan viitekehys

Kirjan ”viitekehys” on SMART-malli:

  • Start with strategy
  • Measure metrics and data
  • Apply analytics
  • Report results
  • Transform business

Malli kuvaa, miten data, siihen perustuva mittaaminen, analytiikka ja raportointi johdetaan yrityksen strategiasta ja viedään muuttamaan yrityksen liiketoimintaa.

Kirjan rakenne seurailee SMART-mallia. Mukana on työpohjia, käytännön esimerkkejä ja kuvia. Jokainen kappale päättyy pääkohtien kertaamiseen. Seuraavassa avataan hieman kutakin SMART-mallin kohtaa.

Strategia

Strategian osalta esitetään laaja strategiakanvas, jonka osia ovat yhtiön merkitys, asiakkaat, operaatiot, rahoitus, kilpailijat ja riskit sekä resurssit.

Kukin kohta jakautuu vielä alakohtiin, esimerkiksi merkitys visioon ja ambitiotasoon ja resurssit IT-järjestelmiin ja dataan, infrastruktuuriin, kyvykkyyksiin sekä kulttuuriin, arvoihin ja johtajuuteen.

Kanvaksen avulla on mahdollisuus määrittää, mitkä ovat yrityksen informaatiotarpeet sen strategian toteuttamisen kannalta ja minkälaisia datoja sen on tarpeen saada ja hyödyntää.

Mittaaminen ja data

Kun strategia on selvä, on aika syventyä erilaisiin datoihin ja niiden mahdollisuuksiin. Kirjan tässä kappaleessa esitellään eri tyyppisiä datoja.

Ensimmäinen jaottelu strukturoitu ja strukturoitumaton (tai ”semistrukturoimaton”) data. Ensin mainitut datat voivat kuvata muun muassa myyntiä, rahoitusta tai asiakkaita. Jälkimmäisessä kyse on kuvista, videoista, internet-sivustoista, tekstidokumenteista tai Power Point-esityksistä.

Toinen jaottelu on jako sisäiseen ja ulkoiseen dataan. Sisäistä on yrityksen tuottama, keräämä ja kontrolloima data, kuten asiakaspalaute, myyntidata tai henkilöstökyselystä saatava data.

Ulkoisen datan osalta esimerkkejä ovat vaikkapa säätilaa kuvaava data, sosiaalista mediaa koskeva data tai julkisen sektorin tuottamat aineistot.

Tämän jälkeen tuodaan esiin uudemmat datalähteet: erilaiset aktiviteetit, kuten verkossa tapahtuva toiminta tai liikkumisen tuottama data. Keskustelut sosiaalisessa mediassa tai puheena tuottavat dataa samoin kuin verkkoon kertyvät kuvat ja videot. Viimeisin mainittu ryhmä uudemmista datalähteistä perustuu erilaisiin sensoreihin. Älypuhelimessa sensoreita ovat GPS:n lisäksi esimerkiksi kiihtyvyyttä tai laitteen lähiympäristöä mittaavat sensorit.

SMART-työskentelyn mukaisesti yrityksen tulee tunnistaa, mitä datalähteitä sillä on käytössään, jotta strategian toteutuksen kannalta olennaisiin kysymyksiin voidaan vastata. Jos dataa ei ole, se pyritään hankkimaan.

Analyysi

Tämän jälkeen siirrytään datan analysointimahdollisuuksiin. Tekstuaalisen datan (joka voi olla myös numeroita), äänen, kuvien, videoiden ja sensoreiden analyysiin on kuhunkin olemassa omia menetelmiään. Lisäksi voidaan tehdä eri aineistoja yhdistäviä analyysejä.

Tekstien analyysien osalta perinteisempiä lähestymistapoja ovat kategorisoinnit, klusteroinnit ja käsitteiden erittely. Hieman uudempana menetelmänä esitellään ”sentimentin” analyysin perustuvia menetelmiä, joissa pyritään tunnistamaan esimerkiksi sitä, missä valossa yrityksen tuotteista tai palveluista puhutaan verkossa.

Saman tyyppiset analyysimahdollisuudet liittyvät puheen analyysiin. Puheen sisällön ohella erittelemisen ohella siitä voidaan tunnistaa puhujan stressiä tai tunnetiloja.

Kuvien ja videoiden analysointi on aikaisemmin perustunut luokitteluun (tageihin). Uudempina mahdollisuuksina mainitaan kasvojentunnistustekniikat, käyttäytymisen havainnointi sekä tilannetietoisuuteen liittyvät tekniikat.

Kasvojentunnistamistekniikan sovellukset epäilemättä palvelevat esimerkiksi rikosten selvittelyä. Käyttäytymiseen liittyen esimerkiksi kaupan hallussa oleva videomateriaalin avulla voidaan tarkastella, miten asiakkaat liikkuvat kaupassa ja kehittää tämän tiedon avulla tuotteiden sijoittelua tai infrastruktuuria muuten.

Tilannetietoisuuden osalta videokuvan analytiikka voi raportoida poikkeavasta toiminnasta tai tapahtumasta ja laukaista sitten ennalta määriteltyjä toimenpiteitä.

Kirjassa kerrotaan New Yorkin eräässä kaupunginosassa tehdystä kokeilusta, jossa sensorit tunnistavat aseen laukauksen äänen ja poliisit saavat sitten automaattisen hälytyksen alueelle. Datana tässä on siten koko kaupunginosan äänimaisema. Suunnitelmissa on, että jatkossa järjestelmä kehittyy niin, että ampumistilanteista saadaan myös automaattisesti videokuvaa.

Facebookin tykkäysten analysointi on yksi (ajankohtainen) esimerkki datojen yhdistämisen mahdollisuuksista. Tutkimuksissa on havaittu esimerkiksi seuraavanlaisia yhteyksiä tykkäyksien osalta:

  • Harley Davidsonista tykkääminen on yhteydessä alhaiseen älykkyyteen
  • Uimisesta tykkääminen on yhteydessä siihen, että on tyytyväinen elämään
  • Maastopyöräilystä  tykkääminen on yhteydessä emotionaaliseen tasapainoon ja rentouteen

Esimerkit on ovat täysin satunnaisia pitkästä listasta.

Raportointi

Raportoinnin osalta voidaan todeta lyhyesti, että kaikki perustuu visualisointiin.

Kenelläkään ei ole aikaa lukea 50 sivuisia raportteja.

Visualisoinnin osalta käydään läpi perinteisiä kuvioita ja erilaisia infografiikoita sekä karttapohjiin perustuvia tekniikoita.

Vinkkejä visualisointiin ovat muun muassa: identifioi kohdeyleisö, räätälöi visualisointi kohdeyleisölle, linkitä visualisointi strategiaan ja lisää visualisointiin lyhyt narratiivi kun tarpeellista.

Kirjassa esitellään Procter & Gamblen kiinnostava tapa hyödyntää dataa, sen analyysiä ja visualisointia johtamisessa ja päätöksenteossa. Yhtiö on perustanut ”tilannehuoneita”, joissa on korkeatasoiset esitystekniikat sekä vakiintuneet esittämiseen ja analyysiin perustuvat protokollat. Kokouksiin osallistuu data-analyytikkoja, jotka osallistuvat keskusteluun tuottamalla visualisointeja ja analyysejä käsittelyssä olevista asioista.

Pienemmässä mittakaavassa edellä esitelty silta datan ja analytiikan osalta hoidetaan johdon dashboardien avulla. Dahsboardien rakentamista käsitellään kirjassa pintapuolisesti.

Liiketoiminnan muuttaminen

SMART-mallin viimeisenä kohtana on liiketoiminnan muuttaminen datan avulla. Tämä voi tarkoittaa asiakkaiden parempaa ymmärtämistä ja kohdentamista, prosessien parantamista, ihmisten terveyden ja hyvinvoinnin edistämistä, turvallisuuden lisäämistä, suorituskyvyn parantamista tai kaupunkisuunnittelun parantamista.

Kirjan mukaan datan hyödyntäminen tulee nähdä sitoutumisena kehittämiseen ja näin strategian toteuttamiseen.

Datasta löytyvät ideat tulee toteuttaa eikä haudata.

Kyse on siten myös evidenssiin pohjautuvan päätöksenteon vankistamisesta. Datan roolin vankistaminen voi johtaa asiakaskokemuksen parantamiseen, brändin vahvistamiseen sekä suorituskyvyn paranemiseen.

Kirjan tämä kappale oli kenties hienoinen pettymys sen jäädessä melko pinnalliseksi. Kappale olisi ollut hyödyllisempi, jos siinä olisi käsitelty enemmän datalähtöisen strategian toimeenpanoa johtamiskysymyksenä tunnistaen esimerkiksi erilaisia esteitä tai heikkouksia. Palaaminen alun strategiakysymyksiin olisi tarjonnut tähän oivallisen mahdollisuuden.

Arviointia

Kirja oli mielenkiintoinen ja lukemisen arvoinen. Siinä oli paljon tuttua, mutta myös uusia ideoita ja esimerkkejä. Kenties vahvimmillaan kirja oli käsiteltäessä datan ja strategian linkkaamista. Tähän tarjottiin myös hyvän oloisia työkaluja. Kuten edeltävässä kappaleessa totesin, kirja olisi ollut jämäkämpi, jos toimeenpanoa olisi tarkasteltu enemmän johtamisen näkökulmasta.

Kirja fokusoi bisneksen kehittämiseen. Samalla se tuo esiin tematiikan pimeitä puolia. Big data ja sen hyödyntäminen luo mahdollisuuksia, jotka loukkaavat yksityisyyttä. Mahdollisuuksia voidaan käyttää myös epäeettiseen tai rikolliseen toimintaan. Lainsäädäntö on erilainen eri maissa ja sääntely on muutoksessa. Monet kirjan esimerkit USA:sta kuulostivat suomalaisesta perspektiivistä melko hurjilta.

Kirja koskettelee myös terveyden ja hyvinvoinnin teemoja. Tämä onkin yksi alue, jossa parhaillaan tiiviisti pohditaan, mitä mahdollisuuksia uudet aineistot ja uudet analyysitavat antavat vaikkapa työterveyden ja työhyvinvoinnin tukemisen alueella. Mahdollisuuksia on varmasti paljon, joskin varovaisuuskin on paikallaan. Ei kuulosta hyvältä, jos uusien aineistojen ja analyysitapojen myötä otetaan taka-askelia esimerkiksi mittausten luotettavuuden osalta.

Bernard Marr: Big Data – Using Smart Big Data Analytics and Metrics to Make Better Decisions and Improve Performance. Wiley, United Kingdom. 2015.

EDIT 31.3.2018 klo 7.42. Kirjoitusvirheiden korjaamista ja pientä stilisointia.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *