TEHISARUST NÜÜDISMUUSIKA JA KULTUURI KONTEKSTIS LAIEMALT

Tarmo Johannes.
Rene Jakobsoni foto

Tarmo Johannes (T. J.): 2020. aastal korraldasime ansambli U: sarjas „Residentuu:r” mitmeid kohtumisi ja loenguid, uurimaks, millised võimalused on tehisintellektil muusikas. Kas sellega annab ka midagi kasulikku teha ja kas me võime jõuda mingi kunstilise tulemuseni? Nüüd on siin vestlemas lisaks minule ansamblist U: Taavi Kerikmäe, Andrus Aaslaid¹, kes oli toona üks sarja „Residentuu:r” lektoreid, ja Taivo Lints², kes seda teemat päris sügavuti tunneb ja kes ka osales aktiivselt „Residentuu:ri” loengutel. Meil oli siis plaanis teha koostöös Taivoga algoritmilist või tehisaru moodi loomingut, aga Covidi tõttu see kahjuks takerdus. Praegu on möödunud sellest neli aastat, vahepeal on ühiskonnas toimunud tehisaru vallas suur plahvatus ja sellest räägitakse väga palju. Andrus, mis on siis vahepeal muutunud?

Andrus Aaslaid.
Virgo Siili foto

Andrus Aaslaid (A. A.): Tehisintellektiteemalise „Residentuur:i” ajal oli meie üks kõige suuremaid hirme see, et ühiskonnas tekib digitaalne lõhe. Et need ühiskonna osad, riigid või üksused, kes jõuavad tehisaru kõigepealt kasutusse võtta, lähevad selle arenguga nii kiiresti eest ära, et teistel puudub igasugune võimalus neile järele jõuda ja et selline eksponentsiaalne areng, kus ei jõuta esirinnas olijatele mitte kunagi järele, sest seal toimub pidevalt kiirenev protsess, lõhestaks maailma. Tänu OpenAI-le see protsess siiski kuidagi demokratiseerus ja me kõik saime maigu suhu, kuidas see toimub. Kogu areng hakkas kulgema kättesaadavamalt ja vähem digitaalselt lõhestatuna.

T. J.: Kas sa pead silmas OpenAI avatud lähtekoodiga platvormi, mille saavutusi võivad põhimõtteliselt kõik kasutada ja edasi arendada?

A. A.: Ma isegi ei mõtle mitte konkreetset tehnoloogiat, vaid seda, et kui ma kirjutan midagi kuhugi, siis ma näen, millised on tehisaru võimalused, — et mida see kastis olev aju oskab ühe või teise asja kohta öelda.

T. J.: Ilmselt on ka OpenAI arendus ChatGTP jõudnud väga paljude inimesteni ja tekitanud ühise pinnase.

A. A.: Meil tekkis hästi palju selliseid tasuta kättesaadavaid tööriistu. Midjourney ja OpenAI ChatGTP, need kaks on meid kõige rohkem mõjutanud, üks kunstiloomet, teine teksti töötlemist. Kusjuures muusika osas ma ei teagi, kas meil on ühte hästi tugevat platvormi välja kujunenud.

Taivo Lints.
Eesti muusika päevade foto

Taivo Lints (T. L.): ChatGTP ja Midjourney olid teksti ja pildi loojatena laiale avalikkusele sobivad, kergesti kätte saadavad ja mõistetavad. Kõikvõimalikke tehisintellekti rakendusi on tööstuses või teaduses olnud aastakümneid, aga enamik neist on väga spetsiifilised ja tehnilised ning ilmselt ei haakunud need tulemuste huvitavuse poolest laiema kasutajaskonnaga.

T. J.: Igatahes on tehisaru üks kuum vestlusteema. Muusika on huvitav valdkond, mille raames seda teemat uurida ja arendada. Ühelt poolt on muusika suures osas küllaltki algoritmiline, päris hästi kirjeldatav ja peaks masinatele „meeldima”, aga teiselt poolt on seal see miski, mida on väga raske valemitega lahti seletada. Kui räägitakse muusikast ja tehisarust, siis tihtipeale üritavad muusikud kaitsta või seletada, miks inimene on parem või vajalikum kui tehisaru. Hiljem võime arutada, miks inimese loodud kunst tundub asendamatu. Aga esmalt, kas teil tuleb meelde praegu olemas olevaid tehisintellekti vahendeid, mida muusikas kasutatakse või mis võivad olla kasulikud tööriistad?

Taavi Kerikmäe.
Rene Jakobsoni foto

Taavi Kerikmäe (T. K.): Sa jagasid selle teema kaheks: et on algoritmiline ja mingi metafüüsiline pool. Mina lisaksin siia veel ka sotsiaalse poole. See on tegelikult hoopis maisem ja ühiskondlikus mõttes probleemne aspekt; minu arvates lähtuvad kõik intriigid tehisintellekti ümber just sellest. Räägime tehisintellektist kui tööriistast: kas see on tööriistana kasutatav ja millistes oludes? Küsimuse teravik on just seal. Mõtleme veidi ajas tagasi populaarsete platvormide MAX MSP või Open Music ja Supercollider peale. Komponeerimine kompuutri assisteerimisel või selle abil on olnud eraldi žanr juba päris kaua aega. Ja kui tõmmata paralleele veel kaugema ajalooga, siis näiteks varajases muusikas leiab väga palju sellist matemaatilist lähenemist komponeerimisele. Kui rääkida käesolevast perioodist, siis arvutil on järjest tekkinud juurde selliseid tööriistu, mis genereerivad sisestatud andmete põhjal justkui uut materjali. Mõelgem John Cage’i või meie oma Udo Kasemetsa peale, kes kasutasid loomingus aleatoorset materjali, mis on omakorda miski, mis poleks nagu meie enda seest tulnud.

See, mida tehisarus näha tahetakse, on ilmselt vahend otsimaks mingit materjali meie antud piirides, piiratud alal. Ja tundub väga erutav, et too piiratav ala võib olla tehisaru mootori enda otsustada — mis pole ilmselt päris tõsi. Tegelikult tuleks küsimus esitada nii: mida me sellest tahame, milleks meil seda vaja võiks olla? Arvutusi võime ju ka ise teha, isegi siis, kui see võtab natuke rohkem aega. Me kujutame ette, et võiksime saada endale mõttelise partneri. Me loome demiurgi või Frankensteini või, kui soovite, siis Aadama enda kõrvale, kes oleks meile vestluspartneriks, intellektiga „olendiks”. See paelub ilmselt paljusid. Kuid ma arvan, et need inimesed, kes seda nii romantiliselt näevad, pole eriti kokku puutunud programmeerimisega. See küsimus seostub mulle paljus ka müügi, turunduse ja äriplaaniga. Miks see nii plahvatuslikult arenenud on, kui see pole seotud mingi intellektuaalse intriigiga? See tuleb soovist panna tehisintellekt tööle ärimudelis, mis kasu tooks. Kuid minu meelest on ohtlik näha kultuuri arenguid peaasjalikult ärilises perspektiivis, mis on praegu päris hoogsalt käimas, eriti siin meie väikeses Eesti vabariigis.

A. A.: Erik Alalooga³ valmistab teatavasti muusikat instrumentidega, mida on väga raske tehisaruga kopeerida. Me vestlesime Erikuga teemal, et sellist kunsti- ja muusikavormi on tehisaruga väga raske harrastada. Erik ütles kuldsed sõnad: „Kunstiga kaasneb soov kunsti teha.” Tehisaru puhul tekib küsimus, miks me siis ei näe nii palju neid virtuaalkeskkondi, mis teeksid muusikateose otsast lõpuni valmis. Sest muusikutel on tahtmine muusikat teha ja mitte ainult klõpsida prompti, eesmärgiga luua teatud sihtgrupile mingisugust nähtust. Oluline on ka laval n-ö hullu panemine. Tehisintellekti roll muusikas on anda pluginaid ja tööriistu, mis meie jaoks teatud protsesse lihtsustaksid, aga kunstnikud tõenäoliselt ei soovi, et mingi teos lihtsalt tehakse nende eest valmis ja nemad saavad seda kellelegi omistada.

T. L.: Kunsti poolelt seda ei soovita, aga soovivad need, kes üritavad selle pealt raha teenida. Jaapanis on näiteks sünteesitud lauljad, kes genereerivad tohutul hulgal laule ja kes on juba aastaid olnud hästi populaarsed, ning see toob ka reaalselt raha sisse nendele, kes sellega tegelevad.

T. K.: Jaapanlaste tehnoloogiad ja teatav tehiskeskkonna romantika on eraldi kultuurinähtus. Teadmine, et see muusika on tehisaru loodud, ja selle muusika vastuvõtmine või üritamine seda mõtestada on minu meelest üks küsimus. Teine küsimus on see, kas me peidame tehisintellekti võtted ja omistame selle muusika mingile inimesele, nii et käsitöönduslik osa on peidetud, must töö vaikselt ära tehtud. Minu meelest tõid sa välja väga hea punkti: kas tehisarul on üldse motivatsiooni midagi luua? Ja teine küsimus on sotsiaalne faktor: tehisaru ei saa innustust ühiskondlikust tagasisidest.

A. A. (Naerdes): See on koht, kus enamikus ulmefilmides hakkavad asjad väga valesti minema. Tehisaru, millel on motivatsioon…

T. K.: Aga siis oleks sellel juba mingi kunstiline ambitsioon ja mõte. Minu meelest kõik siia takerdubki. Tehisintellektil ei ole otseselt motivatsiooni olla kunstnik või muusik. Või vähemalt on selle motivatsiooni all võimatu ette kujutada mingit autasu. Muidugi ei tegele me kunstiga autasu pärast. Me mõtleme siin mingisugust suhtlust, tagasisidet või kommunikatsiooni. Tehisaru on raske näha millegi muuna kui arvutusliku tööriistana. Kuigi tänapäeval on tekkinud ka teistsuguseid näiteid. Läti trupp Collegium Musicum Rīga proovis näiteks rekonstrueerida barokkooperit, mille muusika oli kadunud.⁴ Kasutades ja analüüsides helilooja enda ja tema kaasaegsete heliloojate säilinud teoste muusikat püüti luua stiili mõttes koherentne teos, nii nagu kasutatakse tehisaru ka maalide rekonstrueerimisel või võltsingute tuvastamisel. Meil on teatud hulk andmeid, mida tehisaru analüüsib ja mille põhjal ta meile vastuse annab. Aga ta ei anna meile loomingulist impulssi.

T. L.: See, et nendes populaarsetes tööriistades puuduvad motivatsioon ning sotsiaalne ja kultuuriline tagasiside, on olnud ilmselt vastavate tööriistade loojate ohutuse eesmärgil tehtud otsusest tulenev, mitte tehniline probleem.

T. J.: Kas sa väidad, et tehisintellekti saaks luua ka nii, et ta arvestaks veel ka sotsiaalsete ootuste ja vajadustega?

T. L.: Jah. Ta ei pruugi seda kohe inimtasemel teha, aga tagasiside mehhanism arvutisüsteemis ei ole midagi keerukat ega uut. Lisaks tehisintellektile on olemas ka selline valdkond nagu tehiselu (artificial life), millel on rohkem bioloogilisi mehhanisme ja süsteemi loomine ei ole põhieesmärk. See on näiteks minu taustaga seotud. See valdkond on olnud väga kitsastes ringkondades populaarne juba vähemalt 1980. aastatest peale ja seal pannakse just nimelt sisse igasugust tagasisidestamist. Luuaksegi süsteem, mis hakkab arvutis vaikselt ise arenema, ja vaadatakse, mis sealt välja tuleb. Aga seal ei ole sees tehisintellekti poolt, nii et esialgu ei teki otsest ohu küsimust.

T. K.: Kas selles kontekstis on loodud ühenduslülid ka „päris maailmaga” või on see autonoomne ja kinnine süsteem, mis lihtsalt modelleerib meile arusaadavalt bioloogilist mudelit?

T. L.: Kuidas kunagi. On välist tagasisidet ka kunstilise poole pealt, kus inimene saab väljendada oma esteetilisi valikuid, näiteks seda, millised arenevad organismid talle välimuse poolest rohkem meeldivad. Ja need saavad siis suurema tõenäosusega edasi areneda. See on juba aastakümneid tagasi tehtud asi.

A. A.: Me jõuame kiiresti sinna, et kaunid suled ja lauluhääl on mõeldud valdavalt selleks, et efektiivselt sugu jätkata ja oma geneetilist koodi võimalikult laial pinnal levitada, samal ajal kui kunstis me võtame vabaduse harrastada seda praktikat ka siis, kui me otseselt kaaslast ei otsi. Ehkki laval tegutseval rokkbändil ju väike lootus on. Kas me jõuame tehisaruga ka sinna välja, et peaksime andma talle motivatsiooni paremini levida ja peaksime siis looma väljaspool raha eksisteeriva, masinatele mõistetava taustsüsteemi? Nii et kui tehisintellekti loodud pilt elektrijaamale meeldib, siis ta annab sellele content’ile jälle natuke rohkem voolu. Ja siis see konteiner on õnnelikum…

T. K.: Klišeed sõnastades: miks hakkavad inimesed noorpõlves bändi tegema? Selleks, et olla populaarsed, leida vastassugupoole, või minu poolest ka sama sugupoole tähelepanu. Motivatsioon selleks (kuigi seda ei saa ainult nii üheselt öelda), et inimesed nühiksid garaažis proove teha, on üksnes tüdrukutele või poistele meeldimine. Me saame sotsiaalset tagasisidet ja miks mitte ka sotsiaalset mässu. Tihti on muusika sotsiaalse faktoriga nii tugevalt seotud, et seda sealt välja tõsta näib keeruline.

T. J.: Ma olen täiesti sama meelt. Muusika puhul on inimesele väga tähtis sotsiaalne roll või kommunikatsioon ja see on üks põhjus, miks muusikat on vaja. Kui me lähtume sellest seisukohast, et muusika sünnib kuulamisel või vastuvõtmisel, siis see Taivo näide, et Jaapanis on hulk inimesi, terve kogukond, kes huviga kuulavad tehisaru tehtud muusikat ja leiavad sealt midagi, ning et kommunikatsiooniahela teises otsas on need, kes genereerivad või tekitavad seda muusikat, siis see on üpris sarnane protsess tavapärasel moel muusika tegemisel toimuvaga, lihtsalt tööriistad on teistsugused.

T. K.: Taivo, sa tunned seda kultuuri osa paremini. Kas on nii, et keegi kunagi ei tea nende arendajaid? Superstaar on anime, kellele projitseeruvad erinevad huvid. See on eraldi „mets”.

T. L.: Põhiline erinevus seisneb selles, et läänes seostuvad küborg ja tehisintellekt esimese hooga terminaatoriga. Filmid on need, mis inimesi kõige rohkem mõjutavad.

T. K.: Või varem raamatud.

T. L.: Jaapanis on see eelkõige anime, sellised lood, kus kõik aitavad inimkonda või integreeruvad inimkonda positiivselt.

A. A.: Muusikas on veel sellestsamast küsimusest ja vastusest lähtuv omapärane dualism, mida teistes kunstivaldkondades nii palju ei ole. Siin on esitaja ja teksti autor ja viisi autor, ehk siis staari küsimus. Seda kohtab ilmselt rohkem rokkmuusikas — tehisintellektist staar ei tõuse karismaatilisuse mõttes teiste seast esile nii nagu inimstaar.

T. K.: Võib olla nii ja naa. Mina väidaksin provotseerivalt, et kui me leiaksime näiteks anonüümsed noodid, mis oleksid muusikaliselt suurepärased, aastaarvgi oleks kirjas, ja paigutaksime need mingisugusesse konteksti, siis see muusika ei saaks väga tuntuks, kuna meil ei ole võimalik seostada seda mingi kindla isiku ja tema loominguga. Samas me teame lugusid millivanillidest, kes ei olnud tegelikult need, kes seda muusikat ise tegid — meie oma Vanilla Ninja on ka esinenud mõnevõrra lindi pealt. Või DJ-d, kellest osa on muidugi väga loomingulised ja teevad ise lugusid — see on eraldi žanr —, aga kes on sellele loomele teatavaks kehandiks.

T. L.: See on suhteliselt hiline nähtus, rahvamuusikat ei seostata ka konkreetse isikuga.

T. K.: Rahvamuusikat võib vaadelda ka kunagise popmuusikana, see ei eksisteerinud ilma Torupilli-Jussi või konkreetse laulikuta, kes simmanil laineid lõi.

T. L.: Simman oli kontserdiolukord, aga töölaulud olid igapäevaelu osa.

T. K.: See on rituaalne või sotsiaalne käitumine.

A. A.: Tulevikus võib olla nii, et populaarne artist tuleb lavale, esineb seal lauluvõistlusel ja tiitrites oleks kirjas: „tekst: ChatGTP, viis: OpenAI”. Ja tema esitab selle täie veendumusega. See on staari puudutav aspekt.

T. K.: Mina väidan, et ei ole.

T. L.: Staare on jäänud aastakümnete jooksul järjest vähemaks. Kuna muusika kättesaadavus ja levik on järjest parem, siis ei ole inimestel enam ühiseid staare, vaid igaüks kuulab oma spetsiifilisi nišiasju.

T. K.: Pole olnud kuulsamat popstaari kui Taylor Swift.

T. L.: Taylor Swifti lugusid ei suuda enamik inimesi ära tunda või ette laulda, Michael Jacksoni laule aga suudaksid inimesed, ükskõik millisest maailma punktist, kaasa laulda.

T. J.: Klassikalise muusika skeenel — kui rääkida iidolitest ja superstaaridest — oleme harjunud sellega, et helilooja on üks konkreetne kunstnik, kelle nime ja elulugu me teame. See on praegu muutumas.

T. K.: Teame sellepärast, et helilooja kui sellise superstaaristaatus on suhteliselt hiljutine nähtus.

T. J.: Tänapäeva klassikalise muusika keskmes on suuresti ajalooline muusika, mille väljakujunenud mudeliks on helilooja — esitaja — publik.

T. K.: Aga mitte 17. ja 18. sajandi muusika puhul, see ei ole sama juhtum. See on piiratud aeg, millal see on toiminud.

T. J.: Ma pidasin silmas tänapäeva valitsevat muusikaelu. See, kes või kus on looja, võib olla muutumises. Ja siit kerkib küsimus, mille sa ennist tõstatasid, et kas tehisaru võib olla vestluspartner või kaaslooja. Kuivõrd võib tehisaru looming olla kunstiliselt relevantne. Üks asi, millega tehisintellekt palju tegeleb, on statistiline pool, masinõppimine, andmete käsitlus ja algoritmid. Aga keeruliseks pooleks on hinnangute andmine, tähenduse loome.

T. L.: See läheb natuke tagasi motivatsiooni küsimuse juurde. Mul jäi enne Andrusele ütlemata see mõte, et mis laadi tagasisidet millelegi anda. Kas panna elektrijaam andma rohkem energiat sellele programmile, mis paremini teeb? — Ei, seda ei pea otsustama mitte elektrijaam, vaid inimesed. Kui on mingi programm või äpp, mis teeb midagi, mis inimesele meeldib, siis inimene laeb selle oma arvutisse ja annab sellele võimaluse joosta. Ja võimalus saada arvutusressurssi on just see, mida tehisintellektil vaja on.

A. A.: Ehk siis tehisaru on parasiteeriv organism, mis tahab laieneda.

T. K.: Nii otsest võrdlust ei saa teha. Ma arvan, et siin mängib kaasa füüsilisuse ja surelikkuse küsimus. Meie keha vajab teatud positiivseid stiimuleid: hea toit, jook, suhted, sotsiaalne tunnustus, ilusad autod, majad… Kogu seda heaolu, mingisuguse ringkonna tunnustust. See kõik motiveerib meid väga palju. Ma kardan, et seda on päris keeruline kanda üle arvutusmaailma. Pelgalt see, et arvutusvõimsust on juures, ei taanda keerukuse ja mitmekihilisuse küsimust ja ka motivatsiooni vajadust on keeruline teisaldada.

T. J.: Mis te arvate, kas tehisaru võiks olla selles mõttes partner, et annab stiimuleid ja on vestluskaaslane ja peegeldaja, keegi, kes mõistab, mida sa teed?

A. A.: Meie praegune põhiline kogemus tehisaruga baseerub keelemudelil. Lihtsustatult tähendab see seda, et me oleme harjunud sõnade taga nägema ja mõistma mingit sõnumit. Kui me võtame hästi suure sõnade andmebaasi, siis meil on seal tõenäoliselt olemas suurem osa kombinatsioone lausetest, mis üksteisega sobivad. Nii et kui me räägime lilledest ja oleme pannud sinna andmebaasi paar miljardit tähemärki lilledest kõnelevaid tekste, siis leiame alati neid sobivaid juppe. Küsimus on selles, kuhu me ta sealt edasi suuname, et ei oleks nii, et pärast kolmandat lauset hakkab tõde ja õigus riburada pidi edasi minema. Meil oleks vaja, et see kõik oleks mõtestatud natukene omapärasemalt, mitte lihtsalt kopeeritud mingit teist teksti edasi sellest kohast, kus meil pooleli jäi. On ka juba natuke huvitavamaks tehtud keelemudeleid: lükkame sisse rohkem juhuslikkust, varieerime seda vastust. Et me ei jääks ühte kohta kinni. Praegu me üritame teha seda võimalikult demokraatlikult ja vähese vahelesegamisega, mis teistpidi tekitab uusi probleeme: see ei vasta tihtipeale meie ühiskonnas välja kujunenud sotsiaalsetele normidele.

T. K.: Ütleme nii, et läheb kurjaks.

A. A.: See on pool muret. „Läheb kurjaks” on vähemalt kuidagigi kirjeldatav, aga me oleme loonud oma ühiskonnas suure hulga tavasid ja norme, millest me peame kinni seetõttu, et nii lihtsalt on: meeste ja naiste võrdõiguslikkusest kuni mingite veel tundlikumate teemadeni. Nagu ma olen kunagi tehisintellektist rääkides öelnud, me oleme inimestena, ühiskonnana paljudes asjades erakordselt ebaratsionaalsed. Tehisintellekti suur probleem on see, et ta ei oska meie ebaratsionaalsust heal viisil kaasata. Me ei tee asju kõige efektiivsemal moel. Kunst ja muusika on selles mõttes toredad, et neisse on ebaratsionaalsus juba sisse kirjutatud. Puht matemaatilisest ja füüsilisest aspektist vaadates pole meil siiamaani väga häid põhjendusi, miks muusika üldse peaks eksisteerima — üks suur kollektiivne ajaraisk üle kogu planeedi. Tõenäoliselt ei juhtuks universumis midagi, kui planeedil Maa muusikat ei tehtaks. Aga ometi me peame seda hädavajalikuks. Sealt on võimalik palju lihtsamat teed pidi edasi minna.

T. K.: Välja arvatud Talibani puhul, kes keelustab radikaalsematel juhtudel igasuguse instrumentaalmuusika, vähemalt sellise, mis ei teeni nende religioosseid rituaale. Huvitav, kas sellistes ühiskondades nagu näiteks Põhja-Korea võiks tehisaru olla efektiivne ka kultuuri vallas?

A. A.: Seal on meil terve hoiatav vihmaussikarp, kui me tuletame meelde eelmisi presidendivalimisi ja Cambridge Analytica nimelist Briti konsultatsioonifirmat, kes suutis masside hirmu abil manipuleerimise edukalt teaduseks muuta. Ma olen varem välja toonud, et kui me võtame praegu ChatGTP mudeli ja paaritame selle Cambridge Analytica mudelitega, saaksime teha juturoboti, mis suudaks panna meid kolme minutiga tegema ükskõik mida, sest tal on kõik manipuleerimise ohjad käes.

T. L.: Cambridge Analytica oli muidugi väga mõjukas, aga mitte nii suurel määral, kui on püütud muljet jätta. See ei suuda inimest nullist ümber veenda. Tänapäeval on enamik valimistulemusi umbes viiekümne protsendi ligi ja paari protsendiga mängida ta suudab. Aga enamikku inimesi ta päris ümber veenda ei suuda.

T. K.: Siit tekib minu meelest päris huvitav teemapüstitus. Me rääkisime sellest, mis eristab meid tehisintellektist. Meil ei ole võimalik tõlkida füüsilisi impulsse, trigger’eid ja motivatsiooni väga otseselt. Ühtlasi ei õnnestu meil tehisaru karistada. Meil pole selget mehhanismi, kuidas teha seda nii, et ta kardaks ja väldiks mingit sorti tegevusi. Tapmise ja suremise tähendus ei ole tema jaoks ilmselt sama mis meie jaoks, kes me elame ajaliste olenditena. Siin me jõuame järjest rohkem ikka küsimuseni, mis on see motivatsioon, mille toel mootor tegutseb. Näiteks kui mingi mudel suudab mõjutada inimeste meelsust, söötes neile ette teatud materjale, ja manipuleerib inimestega, kes teatavat meediat tarbivad. Siis on meil ilmselt vaja kahte asja: et seda meediat tarbitaks ja et oleks motivaator. Kas meil õnnestuks teha mõni helilooja selliste vahenditega kuulsaks?

Kui me neli aastat tagasi tegelesime tehisintellekti teemaga, siis proovisime lihtsalt kättesaadavate vahenditega tekitada mootorit, mis oleks nüüdismuusika loomisel kuidagi tähenduslik, suudaks luua midagi põnevat, mis oleks antud kontekstis relevantne. Me avastasime, et vähemasti tol hetkel olid kõik need mootorid arendatud eelkõige popmuusika või igapäevase tarbemuusika suunitlusega, pidades silmas taustamuusikat, mida kasutatakse kaubanduskeskustes, avalikus ruumis, filminduses. See on väga selgelt ärimudelile, mitte filosoofilisele intriigile suunatud arendustegevus. Mulle küll tundub, et mida võimsamaks see tööriist muutub, seda enam võib see hakata alla suruma kultuurimudeleid, mis ei ole otseselt majanduskasvule orienteeritud. Mina näen neid ohumärke väga selgelt. Ma ei suudaks tõenäoliselt hoomata, kui palju on tehisintellekti abil tehtud igasugust muusikat, mis kõlab erinevate raadio- ja telesaadete või podcast’ide, dokumentaalfilmide või kaubanduskeskuste taustaks. Aga see mind isegi ei häiri. Võib-olla on mul kahju inimestest, kes on seetõttu oma töö kaotanud, sest need protsendid, mida artiklitest võib juba lugeda, on vägagi suured. Filmiheliloojad kaotavad igal aastal kümneid protsente tulust, mida nad varem on teeninud. Minu mure on pigem see, et tarbemuusika järjest jõulisem pealetung mõjutab oluliselt globaalseid protsesse, lämmatab väikesi kummalisi „taimi”, mille eest tuleb ekstra hoolt kanda ja mis vajavad eraldi vahendeid ja tähelepanu. Kas teie ei näe siin ohtu?

A. A.: Võtame tänapäeva äriühiskonna. Oletame, et ma pean kirjutama Tarmole dokumendi. Ma kirjutan kõigepealt paar mõtet, siis ütlen ChatGTP-le: „Siin on minu paar mõtet, kirjuta palun üks kiri.” Tarmo saab selle leheküljepikkuse kirja, aeg on hiline. Ta saadab kirja ChatGTP-le ja palub: „Ütle mulle kolme lausega, mida siin öeldud on”, ja saab enam-vähem needsamad kolm lauset tagasi, mille põhjal see tekst oli genereeritud. Suur osa äridokumentatsiooni ja kirjavahetust toimubki praegu sellisel moel. Varem me raiskasime ühiskonnana selle vahu loomiseks tohutult aega — et luua seda liftimuusikat või illustratsioonide näol „tapeeti” mingitele veebilehtedele. Tõsi, see tõi mingitele inimestele leiva lauale. Nüüd liigume ajas veel rohkem tagasi, sinna ketrusmasinate manu, kus meile tundus, et kõik on ühel hetkel töötud, kui ei saa kedrata hommikust õhtuni, ja jäävad üldse nälga. Kuidagi me ühiskonnana selle aja siiski ära sisustasime, kui ei pidanud enam käsitsi ketrama. Võib-olla on tehisaru kunstis, muusikas ja üldse loomingus selline tööriist, mis meid sellest ketrusmasina orjusest vabastab. Nii et „liftimuusika” sünnib lifti enda tehtuna mingisuguses kohas.

T. K.: Kas see ei tähenda siis seda, et me muutume „liftimuusika” suhtes immuunseks? Näiteks kui tulid tööstuslikult tehtud riided, hakkasime me suhtuma riietusesemetesse hoopis teistmoodi kui varem. Me ilmselgelt ei väärtusta linast särki nii, nagu teeksime kontekstis, kus inimesed on linad kasvatanud, kraasinud, leotanud, tagunud, pleegitanud… Mina väidan, et me käsitleme rudimendi või prügina tervet hulka taustamaterjali, mis tegelikult on tähenduslik, aga mille me viskame välja seoses ChatGTP tulekuga. Näiteks ühes muusika ja tehnoloogia teemalises vestlusringis öeldi, et mõtle kui tore, meil on nüüd võimalik teha näiteks pilliõpet üle veebi. Siit sammuke edasi oleks näiteks see, et vaata kui tore, kui meil oleks võimalik teha klassikalise akustilise kitarri tunde, kus õpilane mängib ja mootor analüüsib ning annab tagasisidet ja ehk ka mingit nõu. Mina aga väidan, et kitarritunni juurde peavad käima kõik sellega seotud ebamugavused. Näiteks laps peab võtma oma kitarri, panema selle kotti ja minema kuhugi tundi, kohtuma õpetajaga kindlal kellaajal, kuulama, mida õpetaja räägib jne. Minu meelest on sellel kitarritunnil isegi väiksem osa kui kogu muul värgil, mis käib sinna juurde ja mis pole mingi suvaline rudiment, vaid oluline osa tervikkogemusest. Need kümme aastat kitarritunde on olulised, ilma et õpilasest peaks isegi kitarristi saama. Tund ise võiks muidugi olla mõtestatud ja efektiivne, aga kogu see sotsiaalne aspekt — teiste õpilastega mõtete vahetamine, kohtumine, mingid suvelaagrid jne — võib olla isegi olulisem. Ja kui sa ütled, et masin teeb sulle selle teksti valmis… Tegelikkuses me vaatame seda masina genereeritud tekstimassi ja otsime sealt tähenduslikku osa; võib-olla laseme ka selle masinal välja filtreerida. Nii jääb meil päris hulk asju tegemata: kuhu panna see koma, mida sõrendada… Loomulikult võib öelda, et masin muutub järjest efektiivsemaks ja lõpuks on see tekst üpris lähedane sellega, mille ma ise oleksin kirjutanud, aga ma väidan, et on terve hulk seda, mis esmapilgul tundub olevat prügi ja mille me masina abiga kõrvaldame, aga mis on tegelikult tähenduslik infokiht.

A. A.: Me jõuame sellesama näite varal umbes kümne aastaga tupikusse, või siis vastupidi, keegi kodanik Musk saab oma neurolingi lõpuks tööle.

T. K.: Väga ohtlik asi.

A. A.: Mis võimaldab sul selle kitarriõppe lihtsalt neljakümne euro eest alla laadida. Ja tulemuseks on see, et meil on suur hulk kitarrimängu oskavaid inimesi, kes ei tohiks seda osata.

T. L.: Ühest küljest olen nõus, et mis konkreetselt kitarriõppesse puutub, siis see annab midagi juurde. Aga teisest küljest tekib küsimus, kas see noor, kes kümme aastat suure hulga oma ajast kitarriõpingutele kulutab, seda oskust ka väärtustab. Või kui palju ta väärtustab. Kas ta väärtustab seda ennekõike sellepärast, et nüüd ta armastab kitarrimuusikat? Või teeb ta seda lihtsalt sellepärast, et ta on investeerinud sellesse nii palju aega, vaeva ja raha, et nüüd oleks psühholoogiliselt vastuvõetamatu see investeering kõrvale lükata?

T. K.: Kas see pole niimoodi enamiku asjadega elus? Kas või söömisega? Söögi tegemine on mingis mõttes täiesti ebaratsionaalne tegevus. Me võiksime süüa väga kindlaid toitaineid iga päev õigetes kogustes. Tegelikkuses aga ei ole söögi tegemine seotud ainult konkreetsete ainete omandamisega, vaid teatava ökoloogilise mõtteviisiga: millised taimed mingis kohas kasvavad, kuidas neid traditsiooniliselt valmistatakse… Kogu see sotsiaalne protsess käib söömisega kaasas. Küsimus ei ole ainult toitainetes, mida meie keha vajab, riietes, mida me kanname, liikurites, millega me liikleme, majades, kus me elame. Need ei ole puhtalt ratsionaalselt loodud keskkonnad. Need on nii laetud kõikvõimalike andmetega, mis minu arvates on sellel mootoril puudu, sest tal puudub füüsiline kehand. Või ma eksin?

T. J.: Ma arvan, et see on hea märksõna — et mida inimene vajab. Mis on inimese vajadused. Sotsiaalsed ja ka kultuurilised vajadused. Ma usun, et tehnoloogia võib seda mõjutada, aga ei muuda seda olemuslikult. See oli vist Arnold Schönberg, kes ütles, et grammofoni tulek on muusika surm. Kuid tegelikult ei ole heliloojad ning muusika kirjutamine ja esitamine kuhugi kadunud.

T. K.: Aga võib-olla oli tal õigus. Võib-olla see hakkas vaikselt surema. (Naerdes.) See lihtsalt pole veel päriselt surnud…

T. L.: Napsteri kohta öeldi ka, et pärast seda, kui kõik saavad tasuta internetist muusikat alla laadida, ei taha enam mitte keegi muusikat teha, aga tulemus on see, et muusikat tehakse rohkem kui eales varem. Igaüks teeb oma kodus muusikat.

T. K.: Need mehhanismid, kuidas muusikat tehakse, on siiski täiesti teistsugused. Näiteks elektroonilise muusika loomine arvutis erineb kardinaalselt sellest, kui õpitakse mängima trompetit. Ma ei tea, kas need kuuluvad isegi sarnasesse valdkonda.

T. J.: Need mõlemad on olemas ja minu meelest on valikuvõimalus pigem hea. Ja hea on ka see, et sa võid valida endale virtuaalse kitarriõpetaja.

T. K.: Väga raske on panna last tänapäeval raamatut lugema, sest see on palju suuremat pingutust nõudev kui liikuva pildi vaatamine. Nii on see päris paljude füüsiliste tegevustega.

T. L.: Ma arvan, et probleem pole mitte niivõrd liikuvas pildis kui selles, kes seda pilti toodab, kes teeb seda isikliku kasumi eesmärgil. Kui seda liikuvat pilti toodetaks hariduslikel eesmärkidel, nii et laps, kes eelistab liikuvat pilti, saab sealt kogu info kiiremini kätte kui raamatust, siis poleks see üldse nii halb.

T. K.: Sellega kaasneb nii palju muutusi, mida me sageli ei märkagi. Võtkem kas või käsitsi kirjutamine, millest me oleme ilmselt kõik enam-vähem loobunud. Nii et kui on vaja kirjutada kusagil käsitsi kaks lauset, on käsi pärast kange. Enamuse ajast me trükime teksti. Väidetavalt on see peenmehaanika, mida harjutatakse pilliõppel või puulusika nikerdamisel, seotud aju arengu protsessidega ja mõjutab lapse kogu arengut. Ma tahan väita, et on hulk asju, mis kaasnevad tehisintellektiga ja millele me ei pööra piisavalt tähelepanu. Olgu sotsiaalne või füüsiline pool, olgu mingite tähenduste või väärtuste ümberhindamine. Ma ei taha öelda, et kõik läheb halvemaks. Aga ma ütlen, et on hulk asju, mille puhul me võime üllatusega avastada, et oleme jõudnud kuhugi, ilma et me oleksime seda tahtnud.

A. A.: Sa kardad, et me teeme inimkonnana kusagil vea?

T. K.: Karuteene. Me oleme vaikimisi hakanud samastama innovatsiooni tehnoloogia arenguga. Me räägime uuendusest või avangardist, me mõtleme kogu aeg, et digitehnoloogia läheb paremaks, kiiremaks, efektiivsemaks jne. Aga innovatsioon võib ju tähendada ka lihtsalt ümbermõtestamist. Majandus ei saa kasvada lõputult. Olukorras, kus rahvaarv kahaneb, võib innovatsioon minna ka teistes suundades. Ta ei pea olema ilmtingimata orienteeritud suurenemisele ja laienemisele ja kiirenemisele. Muusika valdkonnas ei pea innovatsioon toimuma efektiivsuse suunas. Minu küsimus on, kas kultuur saab minna tehisintellekti tõttu efektiivsemaks. Mismoodi saab kultuur üldse olla efektiivsem? Müük saab olla efektiivsem. Aga kultuur? See on absurdne küsimus.

T. L.: Ma olen täiesti nõus, et kõikvõimalikke humanitaaria harusid peaks rohkem arvesse võtma, tegelema nende keerukate küsimustega — ühiskondliku innovatsiooniga, ühiskonnakorraldusega, kõige sellega, mida me võtame iseenesestmõistetavana. Tegelikult on seal palju ruumi innovatsiooniks.

T. K.: Meil on selline plaan, et tahaksime koostöös CoPeCo ja Eesti Nüüdismuusika Keskusega võtta CoPeCo nüüdismuusika magistriprogrammi tudengiks vastu ühe tehisintellekti mootori, sööta talle neidsamu materjale, mida saavad üliõpilased, ja vaadata, kuhu ta kahe aasta pärast välja jõuab. Nõuded on teada: lõpuks peab olema kolmkümmend minutit loomet.

T. L.: Ilmselt on oluline rõhutada, et see, mida enamik inimesi praegu laiemalt tehisaru all mõtleb, on keelemudelid. Aga kui vaadelda seda teaduse poole pealt, siis keelemudelid on vaid pisike osa kogu sellest väljast. Tegelikult ei ole keelemudelid eriti representatiivsed, kui jutt on tehisaru võimalustest. Tasub meeles pidada, et on palju teistsuguseid lähenemisviise, millel on omad tugevused ja nõrkused. Teadlased arendavad neid vaikselt ja pole välistatud, et mõni muu versioon läheb sellest praegusest keelemudeli buumist mööda.

T. K.: Sina oled programmeerija. Milles sina näed tehisintellekti võimalikku kasu muusika valdkonnale? Miks ta vääriks arendamist, investeerimist, aega ja tähelepanu? Milline suundumus võiks olla muusika valdkonnale oluline?

T. L.: Mulle meeldib teha selliseid süsteeme, mis suudavad mind üllatada või luua mingeid asju, mille peale ma ise pole tulnud.

T. K.: Kas teatud variantsus?

T. L.: Mõnes mõttes ka innovatsioon.

T. K.: Kas seal on ka mingi loojafaktor sees, kui sa suudad teha midagi, mis sind üllatab? Või piisab sellest, kui tooksin sinu juurde huvitava inimese, kes sind üllataks?

T. L.: Põhimõtteline vahe seisneb selles, et kui mina teen tehisintellekti süsteemi, siis tunnen ma ennast vähemalt osaliselt selle autorina, mida tehisintellekti süsteem teeb. Enamik inimesi ainult kasutab neid süsteeme. Sellel on hoopis teistsugune suhe tulemusega. Mustale kastile lihtsalt söödetakse midagi ja saadakse midagi vastu. Mina tean täpselt, miks ma midagi ehitan ja millist tulemust ma soovin, ja ma saan seda ka vajalikus suunas juhtida.

T. K.: Kas see on midagi, mida sa ise ei suudaks ilma tehisaru süsteemi loomiseta saavutada?

T. L.: Seda on raske öelda, kas ma suudaksin mingit muusikalist tulemust saavutada. Minu jaoks on selle vahendi loomine omaette nauditav loomisprotsess. Ma ei loo seda puhtalt utilitaarsel eesmärgil. Sealt tuleb lihtsalt järgmise astme looming.

T. J.: Ja sellega on seotud väga palju sinu enda valikuid ja hinnanguid.

T. K.: Kas see pole oluline, et inimesel, kes kuulab lõpp-produkti, oleks mingigi arusaam sellest, kuidas see mehhanism töötab?

T. L.: Nii ja naa. Tegelikult mulle muidugi meeldiks, kui rohkem inimesi saaks aru sellest, mis süsteemide sees toimub. Mulle on sageli süsteemi loomine huvitavam kui lõpp-produkt. Filosoofilisemalt vaadates on see üks võimalik näide intellekti tööst. Me üritame aru saada, kuidas üldse inimintellekt töötab. Mida rohkem me kasutame tehisaru tööriistu, seda rohkem hakkame mõtestama ja filosofeerima selle üle, mida üldse tähendab olla inimesena muusika looja. Kui meil on kõrval teine näide loovast süsteemist, siis tekib küsimus, kas inimeses loojana on midagi unikaalset.

T. K.: See mõttekäik on igati arusaadav. Kuid kõikvõimalike tarkvaralahenduste tõttu vaagub näiteks fotograafia praegu surma piiril. Ma tahan öelda, et meil õnnestub selliste mudelitega väga hästi analüüsida asjade välist külge. Samas ma arvan, et peale vaadates ei suudaks ma vahet teha, kas mingi foto on filtritega paremaks tehtud. Spetsialist näeb, millised on valguse ja kadreeringu detailid, mina ei oska näha nüansse, mida fotograaf püüab oma loominguga näidata.

A. A.: Sa ei suuda vahet teha selle tõttu, et keelemudelid on väga populaarsed. Me oleme vahetegemise raskendamiseks võtnud kasutusele tohutu hulga andmeid, mis ütlevad, kuidas seda asja on varem tehtud. Mõnes mõttes on kõik, mida sa ChatGTP käest saad, tegelikult ühel või teisel moel plagiaat. See baseerub asjadel, mis on varem olemas olnud. Kui me räägime kunsti ja tehisintellekti kokkupuutepunktidest, siis kuidas me mõõdame kunsti tajumist, emotsioone ja hinnanguid, kuidas me tõlgime neid masinatele? Pime tehisaru ei saa aru, mis meid tegelikult motiveerib. Ta võtab lihtsalt ühe suure andmebaasi ja teab, et asjad toimivad mingis järjekorras. Järelikult peaks see suuremale osale inimestest ka sobima. Ja sobib ka.

T. L.: Fotograafia puhul on tegelikult küsimus selles, kas tänapäeval on nende inimeste hulk, kes saavad aru, kuidas fotoga on manipuleeritud, väiksem või suurem. Enamik inimesi manipuleerib fotodega iga päev. Nad näevad fotot enne ja pärast ning saavad aru, mis fotoga juhtub ja kus muudatused on. Ilmselt tunneb suurem osa Instagrami kasutajaid ära manipuleeritud foto.

T. K.: Rääkides nüüd innovatsioonist ja sellest, et mis on Eesti Nokia ja kuidas me saaksime seda edasi arendada, siis võiks juurutada sellist kaubamärki nagu human-made-music. Panna digitaalne tempel muusikale, mis on konkreetse inimese tehtud. Ma ei taha öelda, et ma ei tarbiks masinate tehtud muusikat, ka seda võib vaimustunult kuulata. Aga oleks viimane aeg juurutada digitaalset allkirja ja templit, nagu vanasti oli „käsitsi tehtud esemed”. Asi pole mitte äris, vaid selles, et ma hakkan inimese tehtud asjade puhul hindama teatavat vildakust või ebatäiuslikkust. Ma hakkan nägema väärtust ökoloogiliselt kasvanud kõveras kurgis ja mõtlema, kuidas ma seda ise kasvataksin.

A. A.: Kunstis laiemalt oleks vaja sellist kleepsu, et selle teose on valmistanud kunstnik, kelle liising on makstud.

T. L.: Fotograafias on see juba kasutusel. Kui Instagramis on tehisaru tehtud pilt, siis on platvormil selle kohta info, et vaataja oleks informeeritud.

T. J.: Võtame siinkohal vestlusringi kokku ja jääme põnevusega ootama, mida toovad lähiaastad ja -kümnendid.

T. K.: 8. ja 9. novembril 2024 on Eesti Nüüdismuusika Keskuses konverents teemal „Tulevik läks meist mööda”, mille raames on eraldi paneel tehisintellektiteemalisteks aruteludeks.

Vasakult: Andrus Aaslaid, Taavi Kerikmäe, Tarmo Johannes ja Taivo Lints.
Mirje Mändla foto

Kommentaarid:

¹ Andrus Aaslaid on programmeerija, insener ja helikunstnik, MIM projekti ja elektron.arti mitmete ettevõtmiste kaasautor.

² Taivo Lints on keerukate kohanevate süsteemide modelleerimisega tegelev teadlane, kes töötab Toidu- ja Fermentatsioonitehnoloogia Arenduskeskuses (TFTAK) ning Tallinna Tehnikaülikoolis (TTÜ) süsteemibioloogia valdkonnas bakterirakkude arvutimudelitega.

³Erik Alalooga on kaitsnud EMTAs doktorikraadi teemal „Meisterdamise süsteemse meetodi väljatöötamine objektiteatrile”. 2022. aastal oli Tartu Kunstimajas avatud tema isikunäitus „Vabastatud masinad”. — M. M.

² Mõeldud on 17. sajandi itaalia helilooja Marco Scacchi barokkooperit „Andromeda”, mille muusika ei ole säilinud. Maailma esimest tehisintellekti rekonstrueeritud barokkooperit etendati Narva ooperipäevadel 2024. — M. M.

Üles kirjutanud MIRJE MÄNDLA

TEHISARUST NÜÜDISMUUSIKA JA KULTUURI KONTEKSTIS LAIEMALT

Vestlusringis Tarmo Johannes, Taavi Kerikmäe, Andrus Aaslaid ja Taivo Lints

Samal teemal

TEHISARUST NÜÜDISMUUSIKA JA KULTUURI KONTEKSTIS LAIEMALT

Vestlusringis Tarmo Johannes, Taavi Kerikmäe, Andrus Aaslaid ja Taivo Lints

Samal teemal

PILK DŽÄSSISUVELE 2025

EESTI MUUSIKA PÄEVAD 2025

ENDISELT INIMHÄÄLELE KESKENDUDES

EESTI FILHARMOONIA KAMMERKOOR TURNEEDEL PÄRDIga