Algus TMK 2024, nr 10, 2025, nr 1
Muusika ja tehisintellekti tulevik
Matthias Röder (M. R.): Mind huvitab väga see, mis toimub andmetega detsentraliseeritud süsteemide puhul (NB! nagu kuulasjakonnas mainiti: võimekus, väikesed artistinišid ja nähtavuse genereerimine), andmete müümisel, tehes need kättesaadavaks masinõppe eesmärgil. Eriti huvitab mind Ocean Protocol Foundationi tegevus. See on sisuliselt detsentraliseeritud andmete turg. Sa saad tekitada andmehoidlaid, mida ka teised saavad kasutada. Nendega võid raha teenida ja kasutada andmeid ilma omaenda andmeid kolmandatele isikutele loovutamata. Ma arvan, et see on väga huvitav paljudele andmeomanikele, kes ei taha või kellel pole vahendeid oma tehisintellekti mudelite loomiseks. Samas usun, et ka oma tehisintellekti mudeli loomine läheb järjest lihtsamaks. Sul on võimalused, kuigi sul pole suurt eelarvet. Muide, ka minul pole selleks suurt eelarvet.
Kuidas tulevikuinternet välja näeb? Praegu ma tegelen interneti või arvutivõrguga mitmel tasandil. Ma arvan, et paljud inimesed piiravad oma kokkupuudet selle andmevõrguga ühe või kahe sisenemispunktiga. Me näeme, et otsingumootorid, nagu Google ja Bing, asendatakse filtrit loovate vestlusrobotitega. Ja siis on sul probleem, kuidas su tööd kõigis nendes otsingutulemustes kajastatakse. Ja Google’iga on sama probleem, mis ChatGPTga. Ma ei tea lahendust. Ma arvan, et see peab olema midagi, mille inimeste võrgustik peab välja mõtlema. Võib-olla näeme taas kasutajavõrgustiku gruppide tõusu, kus inimestel on „väikesed huvid”— gruppide puhul, kus tead, et selline infovahetus võib toimuda.
Maximilian Schich (M. S.): Väga huvitav. Ma tahaksin mainida kahte punkti: esiteks, võimalikkuse ja tähenduslikkuse vahel on tohutu erinevus. Ja teiseks, sisenemise viise tähenduslikkuse dimensiooni veel ei teata…
M. R.: …meie puhul…
M. S. : …minevikumuusikasse. Mõlemad toimivad samal ajal: see, mis on võimalik, ja see, mis on mõttekas. Me ei tea, milline on tulevikumuusika, ka mitte eesti tulevikumuusika. Minu lemmiknäide põhineb mu kunstiajaloo taustal: muuseumide kogumisprofiiliks on praegu kunst, mis on loodud aastatel 1965–1970. Võib arvata, et pooled kunstiteosed, mis võiksid praegu olla muuseumides või jõuavad muuseumidesse järgmise 30–40 aasta jooksul, on endiselt inimeste elutubades. Meil pole neist aimugi.
Nii et mõnes mõttes oleme me Karajani arhivaarid, aga me ei saa olla praegu loodavate teoste arhivaarid. See, mida me praegu näeme, on jäämäe tipp. Minu arvates on üks võtmeaspekte leida see nišš võimaluste laias ookeanis. Kõik, mida sa vajad, on konkreetne instrument, mille oleksid ise ehitanud; kasutad natuke matemaatikat või mõnda uut viisi vanade asjade nägemiseks või uut kohta, kus seda mängida. Keegi võib leida just sellise ruumi, kus tema kitarr eriti hästi kõlab. Ja seda loomingut tuleb, kuigi selle loojad ei pruugi olla rikkad, nad ei pruugi olla privilegeeritud, aga nad toodavad midagi, mis rokib ja on vinge.
Päris huvitav on vaadata möödunud sajandi muusikaajalugu, 1940.–1950. aastate muusikat. On suurepäraseid teoseid, mida me peame nüüd parimaks muusikaks. See muusika ei tekkinud kindlasti mitte Ivy League’i ülikoolides, Berkeleys või mõnes muus sellises kohas. Kuidas leida vingeid kohti? Hiljutisel kultuurianalüütika konverentsil oli muide saja kaastöö hulgas ainult kaks-kolm muusikateemalist ettekannet. Tuleb arvestada sellega, kui hiljutine on tehisintellekti tehnoloogia, kuid muusika on alati olnud seotud tehnoloogiaga, teatrites peab ruum resoneerima kõneldud heliga jne.
Saksa keeles on sõna entgrenzen, piiridest vabanemine, mida inglise keeles ei ole. Mainin siin itaalia helilooja Ferruccio Busoni raamatut „Entwurf einer neuen Aesthetik der Tonkunst.”1 Busoni oli pianist, ta pillil olid diskreetsed klahvid, kuid ta unistas mingist pidevast glissando’st, keeratavast nupust, mida 20. sajandi alguses polnud, aga nüüd on see peaaegu igal instrumendil, mis tahes digiklaveril on tõenäoliselt mingi nupp, mille abil sa saad oma heli filtreerida.
Selline oli praeguse elektroonilise muusika teoreetiline algus. Kuid siis kulus aega kuni 1960. aastateni, et jõuda arvuti kui muusikainstrumendini. Seda kirjeldas 1963. aastal ajakirjas Science ilmunud artiklis „The Digital Computer as a Musical Instrument” Max Mathews,2 kes oli ka esimese arvutigraafika süsteemi Graphic 1 (1965) kaasarendaja. See oli mõeldud inseneritööks, CAD-disainiks (computer-aided design) ja graafiliseks kuvamiseks, aga Mathews kasutas seda ka muusika loomiseks [ja see on enamiku arvutipõhiste graafiliste kompositsioonikeskkondade n-ö eelkäija]. Mathews rõhutab oma artiklis, et arvuti mitte ainult ei suuda toota muusikat: kui arvuti suudab toota 10 000 arvu sekundis [sämplimissagedus e. diskreetimissagedus], saab mängida mis tahes heli kuni 5000 Hz-ni. Ja kui see on 40 000, siis on võimalik heli sagedusega kuni 20 000 Hz. Võimalike kompositsioonide arv on üks saja kahekümne kaheksa nulliga. Seda on rohkem kui aatomeid universumis. See on lihtsalt uskumatu arv. Betty Shannon (kes oli abielus Claude Shannoniga ja tema peamine kaasteadlane) koos John R. Pierce’iga3 arvutasid, mitu üleminekut ühelt noodilt teisele on Mozarti muusikas, ja veeretasid seejärel täringuid, et leida noodijada, mis oli põhimõtteliselt tehis-Mozart. Matthias mainis ka Markovi ahelalgoritmi, mis leiutati ligikaudu samal ajal, sellega tegeles umbes sama seltskond, sh Belli laboris (USA). Ja nad mõistsid, et see kõlab kolm kuni kümme sekundit suurepäraselt ja muutub siis uskumatult igavaks. Võrreldes võimaluste arvuga üks saja kahekümne kaheksa nulliga, on selline lähenemine uskumatult piiratud. Ma arvan, et see on kultuurianalüütikutele võrdlemisi alandav teadmine. Me ei saa mingil juhul aru kogu võimalikust muusikast või kogu võimalikust kujutavast kunstist või kõigist võimalikest tekstidest. Ja kultuur näib olevat piiratud. See on põhjus, miks andmestikud on nii olulised.
Kuid see tähendab ka seda, et tohutus võimaliku, kuid igava kraami meres võib leiduda selliseid nišše, kuhu juba olemas olevaga ei pääse. Hoolimata sellest, et kõik andmed on riiklikus raamatukogus — kõik andmed ja kogu muusika, mis on kunagi avaldatud —, ei pruugi meil olla juurdepääsu järgmise saja aasta jooksul loodavale kõige ägedamale muusikale.
Arvan, et see on suur väljakutse. Mulle väga meeldib sinu töös, Matthias, ja Mar Canet Sola kui generatiivse kunstniku töös see, et analüüs ja loovus, esitus ja praktika käivad koos. Sest see on ainus viis, kuidas me saame end juba tuttavate asjade piiratud igavusest välja vingerdada.
Ja muusika pakub hullumeelseid võimalusi. Sest läheneda saab igale instrumendile nii, et kui näiteks lubad endale tabada vale nooti, on alati võimalik välja mõelda midagi, mida keegi pole kunagi kuulnud. See on midagi, mille üle oleks minu arvates huvitav arutleda selle vestlusringi viimase 15 minuti jooksul: kuidas me näeme tulevikku? Mis on väljaspool seda, mida me praegu teeme? Meil on kõik andmed olemas, kõik meie 1990. aastate unistused on täitunud, isegi vaestel inimestel on mobiiltelefon, mis suudab teha kõike, neil on GarageBand (helitöötlustarkvara, kas või mõni tasuta versioon). Niisiis, kuidas näevad välja järgmised kümme aastat? Nt luuakse Beethoveni Üheteistkümnes sümfoonia?
M. R.: See pole lihtne küsimus. Beethoveni Üheteistkümnendat ei looda kindlasti… või äkki keegi siiski teeb seda? Ma arvan, et praegu toimub tehisintellekti ümber tõesti rebimine. Ja paljude inimeste arvamus näib olevat selline, et tuleb üks mudel, mis võidab. See on Peter Thieli arvamus, mida ta kirjeldas raamatus „Zero to One: Notes on Startups, or How to Build the Future”4. Ameerika investorina tegi ta PayPali, ta oli Palantiri ja teiste ettevõtete asutajaliige. Thiel on suur riskikapitalist. Ja tema teooria on järgmine: mida iganes sa teed, mis probleemi sa ka ei lahenda (sest idufirmad mõtlevad probleemidele, mida nad lahendavad), tahavad nad hiljem omada turul täielikku monopoli. See on parim tulemus neile ja investoritele ja kõigile. Nemad ja Peter Thiel usuvad, et annavad meile siis hea tehnoloogia. Ma arvan, et selline mudel on täiesti aegunud. Ma arvan, et see, mida me selle asemel näeme, ei ole monopoolne süsteem, sest see takistab edasist innovatsiooni. Sisuliselt pole monopolistil kavatsust teha rohkem edusamme. Nad tahavad lüpsta lehma seni, kuni lehm on elus ja kuni probleem püsib ja nende lahendus aitab.
Ma arvan, et selle asemel näeme olukorda, kus nullist ühele jõudmine ja kõigi oma investeeringute tagasiteenimine muutub äärmiselt keeruliseks, sest sinu loodud lahendus on kohe saadaval paljudele teistele inimestele. Seega jagad sa pidevalt turgu oma loodud uuenduste ümber ja innovatsioonil riskikapitali stiilis on lõpp. Sest miks ma panen oma raha millessegi, mida ma kunagi tagasi ei saa? Aga see on omamoodi innovatsiooni algus, mis tõesti ajendab lahendama meie ühiskonna jaoks olulisi kollektiivseid probleeme. Ja me panustame oma ressursside ja loovusega nende probleemide ühisesse lahendamisse. Tegelikult ei olegi eesmärk kogu seda raha tagasi saada, vaid pigem liikuda järgmise probleemi juurde ja see lahendada. See on omamoodi Peter Thieli ideede ümberpööramine.
Mida see muusika ja kunsti jaoks tähendab? Ma pole kindel. Mul on tunne, et praegu on selline trend, et kunstnikud ei taha, et nende tööd kasutataks tehisnärvivõrkude treenimisel. Kuid ma arvan, et see võib olla vale tee. Sellised kunstnikud jätavad oma tööd sellest diskursusest välja, seega jäävad väljapoole tegelikku interaktiivsust teiste kunstnikega. Ja nad hakkavad kunstiteoseid looma ilma avalikkuseta. Mida me peame tuleviku jaoks tegema: peame praegu tagama, et oleks hästi läbipaistev, mis läheb tehisnärvivõrku, ja et meil oleksid paigas protsessid, mis tegelikult levitavad nende võrkude loodud väärtust treeningandmekogus osalejatele.
Seega on küsimus raha ümberjagamises. See on minu arvates suur arutelu, mida me siin veidi puudutasime. Ja ma arvan, et siin tehakse järgmise paari kuu ja aasta jooksul olulisi otsuseid. Minu vaatenurk sellele kõigele on järgmine: me näeme, mis juhtus Wikipediaga, mida finantseeritakse nn ühisrahastuse (crowd funding) printsiibil, mis kogub ja esitleb teadmisi. Me saame ilmselt näha, et see juhtubki maailma suurte lahendamata probleemidega. Me ilmselt näeme andmebaase, mis loetlevad üles kõik probleemid, mida saab lahendada. Ja me näeme ka läbipaistvaid tehisarude tehisnärvivõrke, mida igaüks saab kasutada, läbi otsida jne. See asendab traditsioonilisi andmete esitamise viise, nagu veebileheküljed. Need ei kao kuhugi, kuid kaotavad oma tähtsuse ja interaktiivse funktsiooni. API-liidesed (application programming interfaces, programmeerimisliidesed arvutite- või arvutiprogrammidevahelise ühendusena) kõigi nende tehisintellektidega asendavad traditsioonilise interneti toimimisviisi. Ja seetõttu muutub ilmselt veidi ka kultuuri tootmine: võrdle siin oma andmekogumi kureerimist ja APIde arendamist oma sisu loomise ja sisust rääkimisega. Arvan, et kunstniku töö muutub mitmetahulisemaks. Ja need aspektid on osa teie tööst. Need siis on minu mõtted tulevikuks. See ei meeldi paljudele, kuid mõnele meeldib.
M. S.: Looduses on pretsedent, mis räägib monopolide vastu. Me ei ole limahallitus, me oleme, nagu Beethoven ütleks, ajuga olendid ja meid on seitse miljardit. Ja kui ühe keskse suurarvuti olemasolul oleks eelis, oleksimegi me tõenäoliselt seda. Kuid sellised me tegelikult pole. Samas on ka altruism5 osa mängust. Seega on küsimus, kas me saame seda optimeerida. Kas me saame optimeerida altruistlikku jagamist, mitte üksteise tapmist. See on minu arvates suur probleem. Küsimus on ahnuses, mis ajendab mentaliteeti „nullist ühele”.
Kuidas me sellega hakkama saame? Mõnes mõttes seisnebki 20. sajandil avaldatud muusika ägedus (ja ma kõhklen, kas öelda „turg” või „tööstus” vms) praegu selle heterogeensuses, kuigi ma näen väga selgelt ka piiratuse/lõplikkuse probleemi. Igaüks võib sellele vastata omast vaatenurgast. Töötasin plaadipoes ja kogusin plaate — mitte palju, kuid püüdsin alati keskenduda neile, mis püsivad kaua. Ja mul oli sügav veider kogemus seoses kohaga, mille nimi oli Josie’s records Dallases Fort Worthis, mis on tohutu suur IKEA-tüüpi pood. Seal on kaks sektsiooni, rock’n’roll ja r’n’b, mis on õigupoolest muusikaturu rassistlik jaotamine valgeks ja mustaks muusikaks. Kui küsida, kus on Giorgio Moroder [nn disko isa] ja Donna Summer [nn disko kuninganna], ei saa teenindajad suunata teid kummalegi poole, sest Giorgio Moroder oleks täielikult rock’n’roll’i all ja Donna Summer täielikult musta muusika all. Ja sa avastad, et kogu rahvusvaheline kraam asub sellises IKEA-suuruses poes ühes pisikeses karbis poe nurgas. Ma olin tõesti üllatunud. See torkab eriti silma klassikalise muusika puhul, see on seal teisiti kui Euroopas.
Lõuna-Saksamaal leidub palju Mozartit, Beethovenit, see on tavaline. Ja Karajan on siin tõeline fenomen. Ta ei ole ainult osa kaanonist, ta on mõnes mõttes kahekohaline protsent kaanonist. Saksamaa inimeste klassikalise muusika plaatide kogust on vast 20–30, isegi 40 protsenti Karajani salvestised. Mida see tähendab? Ilmselgelt ei saa see olla peegeldus sellest, mis juhtus klassikalise muusikaga viimastel sajanditel. Ja teine küsimus on, milline on pärand tulevikule? Kas näeme täielikku ümberseadistamist? Sest USA olukord tähendab minu jaoks väga selgelt seda, et kogu viimase 50 aasta jooksul ilmunud muusikat ei saa kokku koguda, sest ei ole võimalik hoomata kõike seda, mis on üldse tehtud.
M. R.: Ma ütleksin enda kogemuse põhjal, et 20–30 protsenti mängitavatest salvestistest pärinevad Karajanilt. Selline protsent tuleneb kindlasti tema toodangu suurest hulgast. Kuid selle taga oli toona ka strateegia, mis tuli ausalt öeldes plaadifirmadelt, nt meie arhiivis on kirjavahetus, kus Deutsche Grammophoni president arutab Herbert von Karajaniga, milliseid teoseid ta järgmisena salvestada võiks. Deutsche Grammophon sundis teda alati tegema asju, mida ta varem polnud teinud. Karajan ütleks: „Nüüd oleme uues ajastus, meil on uus tehnoloogia ja ma pean suunama oma energiat parima võimaliku versiooni loomisele. Ma tahaksin seda väga uuesti teha.” Kuigi ta oli seda juba kolm-neli korda teinud. Ja plaadifirma ütleks: „Ei, me tahame kataloogi laiendada.” Nad pidid sisuliselt leidma ühise keele. Kui me lõime oma andmebaasi kõigist tema plaatidest ja kontsertidest, oli tulemus hämmastav: ta salvestas üle 280 helilooja muusika.
M. S.: See on lihtsalt uskumatu.
M. R.: Seda kõike, üle 280 helilooja loomingu salvestised, võib avastada veebilehel discoverkarajan.com. Kogu andmebaas on seal ligipääsetav. Isegi kaardil on kuvatav, kus ta mida tegi. Karajan salvestas 1950. aastatel kontserdil Hollywood Bowlis (1959) koos Los Angelese Filharmooniaorkestriga Charles Ivesi orkestriteose „The Unanswered Question” („Vastamata küsimus”, 1906/1935). [See on selle teose esimene esitus pärast partituuri trükis ilmumist 1953.] Ta tegeles imelike asjadega, mida keegi teine ei teeks. Tõsi, ta ei salvestanud seda kunagi plaadile. Kuid ta katsetas paljude asjadega. See lai tegutsemishaare aitab meid tänapäeval palju, sest kui otsida nt Spotifyst Brahmsi, on tõenäoline, et leiad ühe Karajani paljudest salvestistest.
M. S.: See ei puuduta siis mitte ainult marginaliseeritud Wendy Carlost ja Glenn Gouldi; me näeme tegelikult ainult valikut toodangust, isegi Karajani enda toodangust. Suurem osa materjalist on palju mitmekesisem, kui see Karajani muusikat kuulavatele inimestele tavaliselt teada on.
M. R.: Jah, ja turg on kummaline, sest just vähe esitatud materjali reklaamlood muudavad selle huvitavaks. Eriline huvi selle vastu on väga väikesel grupil inimestel. Ja meile meeldib sellega tegelda. Sest see suurendab Karajani jalajälge. Aga samas tahab turg lõõgastava muusika esituste loendit ja ma austan ka seda, ma vajan ka ise seda päris palju. Kuid need jõud, millega sa kunstnikuna kokku puutud, tõmbavad sind mõnikord sinna, kuhu sa kunstilises mõttes minna ei taha.
Niisiis püüame Karajani mitmekesist toodangut võimalikult hästi dokumenteerida ja integreerime selle kõik oma kataloogi andmekogusse, ja loodame, et keegi tulevikus selle üles leiab. Püüame kasutada kaasavat lähenemist. Ja samal ajal mõistame, et enamik inimesi hakkab kuulama valssi „Ilusal sinisel Doonaul” (1866, Johann Strauss II). See on hea muusika ja Karajani salvestised on suurepärased, see muusika on imeline kogemus. Tore, kui suudame inimesi sellest vaimustuma panna. Kui nad tahavad rohkem, võivad nad sukelduda sügavamale. Toon alati sellise metafoori, et sisenemispunktid Karajani universumisse on peaaegu nagu sisenemispunktid rakku. On sellised kanalid, mille kaudu valk avab raku ja siseneb sinna. Nii et suured (tuntud) teosed on nagu raku valguretseptorid — me tahame rakku pääseda ja see toimub andmete kaudu.
M. S.: Jah, tänan sind väga. Mulle väga meeldib see võrdlus. Loodan, et ka teie, kuulajad [lugejad] pääsete sellisesse rakku ja väljute sealt veidi teistsugusena, et saaksite edasi suhelda teiste teoste ja teistsuguste valkudega. Tänan teid väga.
Vestluse tõlkis lühendatult eesti keelde GERHARD LOCK
Tõlkija järelsõna:
Tõlkija viibis seminaril publiku hulgas. Kui ajakiri Teater. Muusika. Kino tegi ettepaneku avaldada see aktuaalne materjal muusikast ja tehisintellektist, tundus loomulik pakkuda sellest seminarist mõistlikult lühendatud tõlge. Seminar toimus Eestis, sellel osales rahvusvaheliselt tuntud ekspert ja seal tutvustati antud valdkonnas rahvusvaheliselt silma paistvat saavutust. Kuigi Matthias Röder ja Maximilian Schich andsid sellise tõlke väljaandmiseks omapoolse üldise nõusoleku, ei vastanud nad ingliskeelse transkriptsiooni redigeerimise käigus kahjuks enam ühelegi minu küsimusele sisu, näidete ja publikuliikmete täisnimede kohta. Seetõttu pidin tegema hoolikaid otsuseid nende probleemide lahendamiseks, et vältida võimalikke rikkumisi, liigset teabe või konteksti kadu ja seda ilma kõigi publikuliikmete nõusolekuta. Mainitud (ja näidatud/esitatud) visuaali ja heli puudutavate näidete puhul otsustasin suunata lugeja projekti Beethoven X meeskonnaliikme Ahmed Elgammali varasema artikli juurde (2021), mis sisaldab ühte Beethoveni 10. sümfoonia visandi fragmenti ja kuulamisfragmenti loodud Scherzo’st. Rohkem visandeid leiab Beethoven-Haus Bonni digitaalarhiivist [BTHVN DA, Sketches, Subdiv (2024), 10. sümfoonia visandid vt Beethoven HCB BSk 20/68 (2024). Vt vestluse II osa]. Bonni Beethoveni orkestri esituses kõlava Scherzo tulemust saab kuulata veebis projekti dokumentaalfilmi ja Youtube’i kanalil Beethoven X: The AI Project. Enamasti otsustasin publiku küsimusi ja kommentaare esitada üldistatud kujul (Matthias Röderi viitamiste kaudu), et vastuste sisu ja kontekst jääksid arusaadavaks. Ühel juhul olin autoris (Mar Canet Sola, TLÜ BFMi nooremteadur) kindel (ja sain kolleegilt ka avaldamisloa) ja see kommentaar oli väga hästi sõnastatud kokkuvõte Beethoveni projektist. Eesti lugeja jaoks olen täiendavalt määratlenud ja kommenteerinud mõned terminid kas sulgudes või märkustes. Sellise (erinevatel põhjustel) hõredalt toimetatud, kuid minu arvates huvitava arutelu avaldamise põhjusteks ja ajenditeks on teema aktuaalsus, soov toetada TLÜ Cudani kultuurianalüütika projekti tegevuste nähtavust laiemale lugejaskonnale ja luua selle kaudu eestikeelset materjali, mis oleks kasulik meie ja teiste õppekavade üliõpilastele.
Gerhard Lock (Tallinna Ülikooli Balti filmi-, meedia- ja kunstide instituut, Integreeritud kunsti, muusika ja multimeedia BA õppekava, muusikateadus ja multimeedia; muusikateadlane, helilooja, õppejõud, toimetaja).
Viited ja kommentaarid:
1 Ferruccio Busoni 1907. Entwurf einer neuen Aesthetik der Tonkunst. Berlin.
2 Max Mathews 1963. The Digital Computer as a Musical Instrument. — Science. Volume 142, nr 3592, 1. XI.
3 Vt John R. Pierce 1961. An Introduction to Information Theory: Symbols, Signals and Noise. New York: Dover Publication.
4 Peter Thiel, Blake Masters 2014. Zero to One: Notes on Startups, or How to Build the Future. Random House.
5 Valmisolek isiklike huvide ohverdamiseks teiste heaolu nimel (ka eetika printsiibina); isetus, omakasupüüdmatus.