Niin levy-yhtiöt kuin yksittäiset muusikotkin haluaisivat mielellään saada käsiinsä hitin kaavan, salaisen reseptin menestysbiisin tekemiseen. Mutta voiko hittipotentiaalia ylipäätään mitata? Kysymystä on pohdittu musiikkipiirien lisäksi myös tietojenkäsittely- ja datatieteen keinoin. Tulokset ovat kiinnostavia, vaikka hitin kaava ei vielä olekaan selvinnyt. Esittelen seuraavassa kaksi viimeaikaista tutkimusta.
Toukokuinen perjantai oli helteinen, mutta siitä huolimatta päätin ohjata kulkuni uimarannan tai terassin sijaan Helsingin yliopiston päärakennukseen, jossa oli alkamassa Digital Humanities Hackathon -nimisen kymmenenpäiväisen intensiivikurssin töiden esittelytilaisuus. Kurssin tarkoituksena oli tuoda yhteen toisaalta tietojenkäsittely- ja datatieteen sekä toisaalta humanististen tieteiden opiskelijoita ja tutkijoita testaamaan tämänlaisen yhteistyön hedelmällisyyttä. Kurssin kansainvälinen osallistujakaarti sai mahdollisuuden kokea itse, miten tietojenkäsittely- ja datatieteen abstraktit mallit taipuvat humanististen tieteitten (historia, kieli, kulttuuri) monimutkaisten kysymysten käsittelyyn.
Näistä lähtökohdista ei ehkä ole ihan selvää, miksi juuri minä – muusikko ja musiikkitieteilijä – olin saapunut paikalle. Vastaus löytyi eräästä tämänvuotisesta teemasta (kurssia on järjestetty jo lähes kymmenen vuoden ajan). Yksi osallistujista muodostettu ryhmä nimittäin analysoi Euroviisujen dataa kahdenkymmenen vuoden ajalta pyrkien selvittämään, mitä piirteitä ja tunnusmerkkejä vuosina 2004–2024 menestyneissä Euroviisu-esityksissä on löydettävissä ja selittäisikö jokin niistä laulujen menestystä.
Kysymys ei ole uusi, eikä alue ole täysin tutkimaton. Reilut kymmenen vuotta sitten Bristolin yliopiston Intelligent Systems Laboratory pyrki löytämään musiikillisia parametrejä, jotka koneoppimisalgoritmien avulla pystyisivät luomaan ”hitin kaavan”, eli ennakoimaan yksittäisen kappaleen hittipotentiaalia. En hetkeäkään epäile, etteikö levy-yhtiöissä tällainen työkalu otettaisi ilahtuneena vastaan!
Englantilaistutkimuksessa materiaalina olivat Euroviisujen sijaan Brittien singlelistan top 40 -laulut kaikkiaan viiden vuosikymmenen ajalta. Tutkijaryhmä erotti lauluista 23 musiikillista parametriä, joista osa oli varsin suoraviivaisia, kuten tempo, tahtilaji, kesto ja äänenvoimakkuus. Osa parametreistä oli kuvauksia laulun harmonisesta yksinkertaisuudesta, sointukierrosta, tanssittavuudesta ja audion sisältämistä hälyäänistä, näin muutaman mainitakseni.
Algoritmi oppi kuin oppikin ennustamaan musiikillisten parametrien perusteella laulun hittipotentiaalin, mutta osumatarkkuus jäi lopulta 60 prosenttiin. Tällä todennäköisyydellä algoritmi ennusti sekä sen, tuleeko laulusta top 5 -laulu, että sen, ettei laulu tule koskaan nousemaan top 30 -listalle.
Tutkimuksen kiinnostavin anti – ainakin itselleni – ei lopulta ollut algoritmin kyky tai kykenemättömyys ennustaa hittipotentiaalia. Tutkimuksen sivutuotteena syntyi nimittäin huomattavan kiinnostavia huomioita siitä, miten musiikillinen maku tutkimuksen kohteena olleina viitenäkymmenenä vuotena oli muuttunut.
Tutkimustuloksista näkyy esimerkiksi, että tanssittavuus ei ollut merkittävää laulun hittipotentiaalin kannalta ennen 1980-lukua. Tälle kenties hieman vastakkainen huomio on, että 1980-luvulla oli poikkeuksellisen todennäköistä, että suhteellisen hidas kappale nousisi hitiksi. Itse asiassa algoritmi pärjäsi ylivoimaisesti huonoiten juuri 1970-luvun lopun ja 1980-luvun alun hittien ennustajana, mikä antaisi ymmärtää, että tuo aika oli erityisen hedelmällistä innovatiiviselle popmusiikille. Kun monenlaiset laulut saattoivat menestyä, hittiä on luonnollisestikin vaikeampi tunnistaa musiikillisten parametrien perusteella.
Parhaiten bristolilaisalgoritmi pärjäsi 1990-luvun alkupuolen musiikissa, mikä on sattumalta myös ajankohta, jolloin hitit alkoivat olla tyypillisesti tasajakoisissa tahtilajeissa (kuten 4/4). Tasajakoisuuden hittitrendi pysyi tutkimusaineistossa seurantajakson loppuun asti. Yksi trendi sen sijaan läpäisi koko aineiston vuosikymmenestä toiseen: äänenvoimakkuuden kasvu. Yleisvoimakkuuden kasvusta huolimatta hitit olivat systemaattisesti aikansa voimakkainta musiikkia.
Bristolin yliopiston tutkimus tuli mieleeni Helsingin yliopiston päärakennuksen ihanasti ilmastoidussa salissa Euroviisu-esitelmää kuunnellessani, koska myös tällä kertaa ”oheishavainnot” olivat tutkimustuloksista kaikkein kiinnostavimpia. Vertailu reilun kymmenen vuoden takaiseen englantilaistutkimukseen on relevantti myös siitä syystä, että tällä kertaa ei keskitytty vain musiikkiin. Musiikin lisäksi Euroviisu-esityksistä analysoitiin muun muassa sanoituksia, visuaalisuutta ja tekijöitten verkostoituneisuutta. Itse asiassa musiikkianalyysi jäi tässä tutkimuksessa silmiinpistävän pieneen rooliin.
Tutkimuskysymyksen laajentaminen perinteisten musiikillisten muuttujien ulkopuolelle on kuitenkin Euroviisu-kontekstissa mielekästä: lienemme yhtä mieltä siitä, että niissä karkeloissa musiikki on vain yksi monesta osatekijästä. Ulkomusiikillisia muuttujia oli tutkimuksessa monenlaisia. Visuaalisuutta tutkittiin analysoimalla kuvan tummien blokkialueitten osuutta koko kuvasta, pyroteknisten efektien osuutta kuvasta sekä kuvan värikkyyttä. Laulun sanoituksissa huomio oli toisteisuudessa, sanoitusten tunnesisällössä sekä aihealueessa.
Mikään tutkittu muuttuja ei sinällään selittänyt tai ennustanut voittajaa, eikä tulosten perusteella ole mahdollista rakentaa menestysesitystä. Mutta kuten sanottu, analyysin paljastamat havainnot laajemmista trendeistä nousivat tutkimuksen kiinnostavimmiksi aspekteiksi. Oletko esimerkiksi tullut ajatelleeksi, että sanoitusten toisteisuus sekä positiiviset tunnesisällöt ovat menestyslauluissa hiipuva keinovara? Myös menestyslaulujen aihesisällöt ovat kahdessa vuosikymmenessä muuttuneet selvästi: teemojen, kuten intohimo ja yhteys, tilalle ovat aihesisällöiksi nousseet henkilökohtaisten vaikeuksien voittaminen ja voimaantuminen. Jäin pohtimaan, peilaako laulujen sisällön muutos ympäröivän maailman muutoksia.
Kurssilaisten Euroviisu-analyysin yllättävin tulos löytyy kuitenkin tekijöitten verkostoitumisesta. Tutkimustulosten mukaan menestysesitysten taustalla näyttävät nimittäin olevan joko musiikkimaailman superverkostoitujat tai sitten täysin
verkostojen ulkopuolella olevat muusikot. Vaikka ilmaisuni superverkostoitujista ja täysin ulkopuolisista muusikoista on kevyesti liioitteleva, verkostoitumista kuvaavan taulukon keskikohdan tyhjyys on silmiinpistävä.
Tässä ollaan mielestäni jonkin olennaisen äärellä: ison datan läpikäynti tietojenkäsittely- ja datatieteen keinoin nostaa esiin ajassa muuttuvia trendejä tavalla, joka jää helposti perinteisen musiikkitieteen ulottumattomiin. Datasta tehdyt havainnot trendeistä ja niitten muutoksista nostavat puolestaan esiin kiinnostavia jatkokysymyksiä havaintojen suhteesta siihen maailmaan, jossa musiikkia tehdään ja kuunnellaan.
Tämänvuotisella kurssilla ei tietääkseni ollut ainuttakaan musiikkitieteilijää, mikä on sääli (ja selittänee osaltaan fokuksen siirtymisen pois musiikillisten parametrien analysoinnista). Kuten olen aiemminkin tällä palstalla toivonut (ks. 3/2023 ”Onko yksi tempo parempi kuin muut?”), näkisin mielelläni musiikintutkimuksen ottavan rohkeammin kiinni data-analyysin ja koneoppimisen mahdollistamista menetelmistä. Kuten edellä esittelemäni tutkimukset osoittavat, kysymysten pohtiminen on hedelmällistä, vaikka se varsinainen hitin kaava jäisikin löytymättä.
Teksti: Sakari Ylivuori
Kuvitus: Lauri Toivio
Artikkeli on julkaistu Muusikko-lehdessä 3/2024.