Hyppää sisältöön

Koneoppiminen valtaa media-alaa – laadukas data avaa mahdollisuudet

Qvik oli järjestämässä Ylen workshop-päivää, jossa pureuduttiin koneoppimisen ja tekoälyn mahdollisuuksiin Suomen mediakentällä. Miten media voisi saavuttaa koneoppimisella kustannushyötyjä ja mahdollisesti myös rakentaa uusia liiketoiminta-alueita?

Ylen CDO Mikko Rusama kutsui mediatoimialan päättäjät kokoon yhteisen asian tiimoilta: millä käytännön toimilla koneoppimista voisi hyödyntää suomalaisella media-alalla paremmin. Paikalla oli media-alan vaikuttajia Yleltä, Sanomilta, Alma Medialta, KSF Medialta, MTV:ltä ja Elisalta.

Suomalaiset mediayhtiöt ovat jo kukin tahollaan ryhtyneet hyödyntämään koneoppimista. Tekoälyä on käytetty esimerkiksi kuva- ja tekstianalyysiin sekä verkkokeskustelujen automaattiseen moderointiin. Media-alan suurin tarve ja konkreettisin hyöty koneoppimisen saralla löytyy tällä hetkellä sisällöntuotannon tehostamisesta sekä vanhojen sisältöjen ymmärtämisestä metadatan avulla.

Qvikin Head of Design Matias Pietilän fasilitoimassa keskustelussa aiheet pyörivät mediatoimijoiden kipupisteiden ympärillä: mihin media-alan ongelmaan tai aihealueeseen koneoppimisella voidaan todella vaikuttaa ja missä uusia ratkaisuja kiperimmin kaivattaisiin. Konkreettisia esimerkkejä haettiin myös maailmalta. Kuulimme Google I/O -tapahtumassa hiljattain esitellyistä koneoppimisen ratkaisuista sekä Spotifyn koneoppikoneistosta.

Tekoälyn mahdollisuuksia miettiessä on hyvä hahmottaa kokonaisuus useasta suunnasta. Voimme hakea kustannussäästöjä prosessien tehostamisen kautta tai etsiä täysin uusia toimintamalleja myös yli toimialarajojen.

Suunnittelusta tuotantoon ja julkaisun kautta kulutukseen

Media-alan ammattilaisille sisällön generoiminen voidaan nähdä suhteellisen lineaarisena prosessina, jossa ideoinnin ja sisällöstä oppimisen väliin mahtuu suunnittelu-, tuotanto-, julkaisu- ja kulutusvaihe.

Ylen konseptisuunnittelija Kim Viljanen kertoi, että Ylellä on ollut useaan näistä vaiheista jo proof-of-concept-projekteja sekä myös tuotannossa olevia palveluita, joissa koneoppimisen hyötyjä on päästy validoimaan. Yle Areenan suosittelujärjestelmä, Ylen Voitto-robotti, Uutisvahti ja verkkokeskusteluiden automaattinen moderointi ovat muutamia konkreettisia esimerkkejä ensimmäisistä askelista koneoppimisen matkalla, mutta mahdollisuuksia on paljon enemmän.

Yksi kiinnostava sovelluskohde koneoppimiselle voisi olla mediatalojen suunnittelutyön avustaminen ja automatisointi. Onko mahdollista ennustaa jo suunnitteluvaiheessa, miten sisältö menestyy, missä kanavissa sitä kannattaa tarjota, missä formaatissa ja mitkä ovat mediakentän trendien kehittyminen lähiaikoina?

Kun teknologiavalinta on oikea, voidaan keskittyä innovaatioihin infran sijaan – ajan ja energian voi hyödyntää uusien asioiden ja konseptien kehittämiseen. Netflix ja Amazon ovat koneoppimisessa edelläkävijöitä, kuten myös Google Cloud Platformia käyttävä Spotify. Spotifyn Oma Daily Mix on hyvä esimerkki uudesta konseptista. Siinä koneoppimista on käytetty kuuntelijan mieltymysten ennustamiseen ja soittolistojen luomiseen.

Data pelastaa, jos se on oikeanlaista

Kaiken lähtökohtana on laadukas sisältö, josta voimme kerätä korkealaatuista metadataa, jonka avulla pääsemme edelleen rakentamaan koneoppimisen malleja. Sisällöstä voi jo nyt tunnistaa kokonaisuuksia kuten tekstiä, entiteettejä tai kasvoja. Näistä voi myös rakentaa prediktiivisiä malleja, joiden avulla suosittelua ja median personointia voidaan parantaa. Myöhemmässä vaiheessa voimme mahdollisesti luoda kokonaan uusia sisältöjä.

Koneoppiminen mahdollistaa myös automaattisen sisältöanalyysin, minkä ansioista arkistoja ja muuta sisältöä voidaan hyödyntää tehokkaammin. Koneoppimisen avulla voi ratkaista myös löydettävyysongelman: sisällön pariin kutsuminen, kiinnostavan sisällön ja julkaisuvaiheen tunnetiloihin yhdistetyn sisällön suosittelu on mahdollista, jos vain metadata on kunnossa.

Kuluttajan kannalta kiinnostavinta on, miten koneoppimisella voidaan parantaa luku-, kuuntelu- tai katselukokemusta. Mediatalojen pitäisi pystyä vastaamaan ihmisten muuttuviin tarpeisiin personoiden. Tämä edellyttää, että ymmärrämme ja tunnemme yleisön preferenssit myös numeraalisesti.

Yleisön tunteminen ei ole Suomen mediataloille mikään liian helppo tehtävä. Esimerkiksi Facebook vaatii kirjautumisen ja siten saa paljon arvokasta tietoa kuluttajista. Moni uutispalvelu ei vaadi mitään kirjautumista, jolloin käyttäjädataakaan ei voida kerätä yhtä paljon tai ainakaan sen laatu ei ole yhtä hyvää.

Parhaimmat liiketoiminnalliset mahdollisuudet voisivat löytyä yhteisten pelisääntöjen ja jopa yhteisen metadatapankin kautta. Yhdessä tekemällä myös koneoppimisen ja keinoälyn mahdollisuudet saataisiin valjastettua meidän pienen markkinamme eduksi. Voisi olla viisaampaa kilpailla osittain yhdessä globaaleja isoja kilpailijoita vastaan eikä pienestä markkinasta keskenään.

Etsi