Mikor kezdted el feltérképezni a blokklánc technológia, a mesterséges neurális hálózatok legújabb fejlesztéseit, illetve azok kreatív alkalmazását a művészet területén?
Évekig kerülgettem. Nem tetszett. Nem éreztem, hogy integrálni tudnám a saját képi világomba. Az eredmények túlzottan egyformák lettek. Aztán talán egy éve, amikor egy ismerősöm megosztott néhány képet, ráéreztem valamire. Akkor vágtam bele. Sokat tanultam az MI-től. Vagyis leginkább nem ő tanult tőlem, hanem én tőle. De azért az első pár hónap egymás kóstolgatásával telt. Talán már év vége volt, mire elkezdtem felvállalható dolgokat generálni.
A tanulás szó ismételt emlegetése azért nem véletlen, mert az MI-ben lezajló folyamatot szinte lehetetlen megérteni anélkül, hogy ne próbálnánk meg valamiféle szabályrendszert felállítani.
Nem mindegy ugyanis, hogy hova írjuk be például a háttér színkezelését az utasításban. Hiszen a beírás helyét az szabja meg, hogy a szándékolt színkezelést az egész kompozícióra akarjuk-e érvényesíteni vagy sem. Ha nem a megfelelő helyre írjuk be, akkor esetleg az egész képet átszínezi. Csakhogy könnyen előfordulhat, hogy éppen ez tesz jót majd a kompozíciónak. Mondhatni, szavakkal festünk.

A Nagy Kreatív KultNapon Szauder Dávid előadásában először a technológiai hátteret, majd a gyakorlati működési elvet mutatja be saját munkákkal és kereskedelmi példákkal is. Szauder 15 éve él Berlinben, ahol művészként, kurátorként, és művészeti tanácsadóként tevékenykedik, itthon pedig példul a Veszprém-Balaton Európa Kulturális Főváros digitális tanácsadója. 2022 októberében illusztrációjával jelent meg a Washington Post különszáma, amit a Creative Review angol szaklap beválogatott a 2022-ben megjelent tíz legjobb borító közé.

Alapvetésed szerint egy képalkotó MI-program „csak” egy eszköz? Az alkotó a valódi kreatív, nem pedig a mesterséges intelligencia?
Egyértelműen eszköz és szerintem eszközként kell kezelnünk. Most persze még nagy az időnként hisztériába átcsapó felhajtás körülötte, ami bizonyos mértékig normális is.
Ránk zúdítottak egy elképesztően könnyen elérhető és kezelhető technológiát, amivel egyelőre nem tudunk mit kezdeni. Az MI évtizedeken keresztül csak a kiváltságosok eszköze volt, és meglehetősen jól kellett tudni programozni, vagy éppenséggel szükség volt egy programozó csapatra ahhoz, hogy egy alkotó használni tudja.
Azonban ez a trainelés sem készen hullott az ölünkbe, vagyis a rendszert meg kellett tanítani az alaptudásra. E helyzetben az előre feltrainelt rendszer és a természetes nyelv használata hozott jelentős változást. Az előbbi jó is meg nem is, hiszen a rendszer alaptudása sokszor jogi kérdéseket vet fel, vagy korlátozhatja az alkotói folyamatot, ám egy kevés többlet tudással és saját traineléssel csodákra képes. A hozadéka meg az, hogy minimális nyelvtudással létrehozzuk a promptokat, vagyis szövegszerűen megfogalmazzuk, amit a képeken látni szeretnénk.
A web3 egyelőre inkább marketinges divatszónak, mintsem valóságnak tekinthető? Illetve felmerül az a kérdés is, amit sok kritikus egyszerűen csak web3-utópiának nevez: a blokklánc technológián alapuló cégek osztják fel újra a piacot?
A problémának nem vagyok szakértője, de számomra sajnos az a lehetőség is elképzelhető, hogy marketing alapúvá válik a dolog, kérdéses azonban, hogy működni tud-e a valóságban.
Alkotói aspektusból tekintve azonban jól látszik, hogy a blockchain akadozik, az NFT felfutása meg lassan alábbhagy, talán túlzottan is. Sokáig úgy gondoltam, hogy ha az NFT átlátható műtárgyeladási lehetőségként a blockchaintől függetlenül is képes a fennmaradásra, akkor megéri az energiabefektetést. Csakhogy jelenleg nem ebbe az irányba megy a dolog. Most nyílt meg a kiállításom az East of Eden galériában, tele MI-vel létrehozott képekkel. Eszembe sem jutott az NFT-t bevonni.

Kognitív tudományos ismeretek nélkül nagyon nehéz megérteni a mesterséges intelligencia lehetőségeiről szóló vitákat?
Megint csak a képalkotásról tudok nyilatkozni. Az egyik vita arról szól, hogy a létrejött termék (alkotás) kinek az alkotása, az emberé-e vagy az MI-é. A másik meg arról, hogy kinek milyen jogosultsága volt valamely műveket betáplálni a rendszerbe a tanítási folyamat során. E viták megértéséhez szerintem semmiféle előképzettség nem szükséges.
Az első vita tárgya a következő. Ha azt kérem az MI-től, hogy csináljon valami szépet és színeset, akkor csinálni fog valami szépet és színeset, persze a saját belátása szerint. És ha ez annyira szép és színes, hogy másoknak is tetszik, akkor lájkolni fogják, netán kiteszik valahol a falra, akár még pénzt is kaphatok érte.
A kérdés azonban az, hogy mindebben mi az aránya a szándékosságnak és az esetlegességnek. Ha ugyanis abban a mesterséges tárolóban nem lenne milliónyi előre beprogramozott kép, akkor bizony nehéz lenne olyan egyszerűen valami szépet és színeset létrehozni. De ez megint csak egyfajta parttalan vitához vezet.
Olyan ez, mint amikor valaki elmegy például egy szuprematista kiállításra és azt gondolja: na, ilyet én is tudok csinálni. De mégsem csinálja. De azért mondogatja. Vagyis csinálni kell. Mert emberi szándék nélkül nem működik.
Ha pedig azt kérjük az MI-től, hogy csináljon valami szépet és színeset, de olyat, amitől rögvest Picassók leszünk – nos, erre roppant kicsi az esély. Mindezt azért is hangsúlyozom, mert esetemben a folyamat, amíg egy képből kép lesz, meglehetősen hosszú, és az MI sokszor már csak ragasztó a folyamat végén. Na jó, meg egy kis extra.

A másik vita meg azért érthető, mert hiszen senki nem kérdezte meg sem Picassót, sem Dalit sem pedig Wes Andersont, hogy vajon akar-e része lenni az MI univerzumnak. De azért nagy hiba lenne azt gondolnunk, hogy egy digitálisan generált kép devalválná bármelyik nagy mestert.
A művészettörténet nagy alkotásai referenciaként igen hasznosak lehetnek, de még véletlenül sem jelentik azt, hogy például egy Dali-képet hozunk létre. Ám ha mondjuk, egy szép égbolt generálására van szükség egy építészeti látványtervhez, akkor Monet kiváló referencia lehet felhők generálásában.
A mesterséges intelligencia ugyanolyan eszköz, mint az ősember faragáshoz használt pattintott köve, később pedig a különböző ecsetek vagy akár a camera obscura, csak ebben az esetben látványosabb a változás?
Már látom magam előtt a lexikoncikket, ha egyáltalán eljutunk odáig: verbális ecsetvonásokkal hozta létre képeit. Nos, igen. Eszköz. Mégpedig varázslatos. De sokat kell dolgozni addig, amíg olyasvalamit hozunk ki belőle, ami nem lesz pont olyan, mint másik 2500 MI-művész képe.
Ehhez megítélésem szerint két dolog kell:
- 1. Saját bevitelű képek, legyen az akár IMG2IMG eljárás, amikor az MI a saját bevitelű képet tekinti referenciának. Vagy a trainelés folyamata, amikor az MI-t arra próbáljuk rábírni, hogy csak tőlünk bevitt képekből építkezzen.
- 2. Lehetőleg egyedi promptokat hozzunk létre, amire megvan a lehetőség, csakhogy... Az MI hirtelen felfutása szükségképpen egy általános hisztériával is együtt jár, hiszen a népszerűsítéshez közösség kell. No, meg persze előfizetők. A közösség tagjai pedig egymásra licitálva ontják a mélydekoltázsú ázsiai félig-vámpírhölgyek portréit a szétrobbanás állapotában. Az egymásralicitálás pedig azt is jelenti, hogy egymás utasításait, promptjait használják fel. A szándék meg, hogy valami egyedit, sajátot hozzanak létre, hiányzik belőlük. Ez így nehéz lesz.

De amikor az MI – a fentieket is beleértve – majd tényleg eszközzé válik, létrejöhet egy kellemes és hasznos együttműködés. A minőség fenntartásán kívül persze szükséges a hibrid jelenségek fenntartása is, vagyis igyekeznünk kell ideális egyensúlyt kialakítani az MI és a nem-MI világa között. Ami ugyancsak az MI integrációs folyamatának része. Ez azonban még korai, mert amíg tart a hype, addig nincs könnyű dolgunk. A napsütéstől nem látjuk a teljes égboltot.
Hol és hogyan tudod értékesíteni alkotásaidat?
Most éppen kifele jövök az NFT-ből, egy francia ügynökségen keresztül még vannak elérhető munkáim, de nem vagyok túl derűlátó. Viszont a kiállításomon az East of Eden galériában árulom is a képeket. Ezek nagyon jó minőségű nyomatok, szépen kasírozva. A galéria tulajdonos Erdész Barna megfogalmazása, hogy kezeljük fotóként nem rossz megközelítés, bár ezek nem fotók. Montázsok. Kollázsok. MI típusú ragasztóval összerakva.
A mesterséges intelligencia művészként is több esetben debütált. A megtévesztés vagy helyettesítés mellett sokszor üzleti, társadalmi és művészeti értéket teremt, emberéleteket ment, vagy épp globális kríziseket old meg. Te milyen viszonyt ápolsz vele?
Nem. Nem és nem. Az MI nem helyettünk működik művészként, mint ahogyan mi sem működünk helyette MI-ként.
Mint korábban is említettem, az MI egy kiváló eszköz. Párbeszédbe lehet vele elegyedni, hiszen akár a képgenerálás esetében is, meg kell értenünk, mire, miként reagál, de nem szabad misztifikálni.
Próbáljuk meg csak elképzelni a képretusálást a photoshop előtt. A retusálás létezett azelőtt is, csak sokkal körülményesebb volt. Ha egy látványtervet kell létrehoznom, nem veszem elő az ultrakörülményes 3D modellező szoftvert, hiszen vannak kész promptjaim, feltöltöm a fotókat az adott térről, picit variálok, iterálok és bumm, ott a profi látványterv.
Házat ugyan nem lehet belőle építeni, de arra megfelelő, hogy érzékeltessem az elgondolást. A megrendelőt talán meg is győzi, utána pedig amúgy is meg kell tervezni az egészet. És ez csak egyetlen példa.

Hogyan térnél ki azon bődületes közhely elől, miszerint a befektetők több milliárd dolláros új iparágat látnak az algoritmusokban, az alkotók viszont morális és etikai kérdéseken merengenek, és attól félnek, hogy elveszítik a munkájukat?
Nem közhelyről van szó, hanem félelemről. A félelem attól, hogy a gépek elveszik az emberek munkáját, egyidejű az ipari forradalommal. Többször elmondtam már, és nem csak én, hogy akkor sem tudták elvenni. Ami megváltozott, az a viszonyunk egyrészt ahhoz, amit a munka jelent, másrészt meg az eszközökhöz, amikkel a munkát végezzük. Most is ez történik.
Forradalminak tartod a MI képalkotó technológiát?
Hát ami igaz, az igaz, nagyon megkönnyíti sokunk munkáját, elképesztő referenciával rendelkezik, de azt is gondolom, hogy ez egy köztes állapot. A kérdés csak az, hogy mik között áll fenn ez a köztes állapot. Mert ha például arra gondolunk, hogy mekkora lépést jelentett képek megalkotása tekintetében a fényképezés feltalálása a rajzoláshoz és festéshez képest, mekkora felfedezés volt a photoshop feltalálása a klasszikus fotóretusáláshoz viszonyítva, akkor be kell látnunk, hogy az MI hatalmas, felfoghatatlan ugrás.
És tudjuk-e, mi lesz még ennél is nagyobb, mi lesz a következő lépés? Jönnek a saját készítésű filmsorozatok? Megadom a kedvenc karaktereimet, néhány referenciát és egy pár rendezőt, és már nézhetem is a soha véget nem érő, személyre szabott MI sorozatomat?

Minden a táplálással kezdődik?
Számomra nem. Koncepció. Tanulmányok. Gyűjtés. Trainelés. Táplálás. De néha azért igen, kipróbálok abszurd dolgokat, csak úgy. Azokból persze ritkán lesz valami izgalmas, de úgy várom az eredményt, akár egy gyermek karácsonykor az ajándékcsomagokat.
Az MI-képkészítésnek jelenleg három úttörője van, a Midjourney, a Stable Diffusion és a Dall-E, mindhármat használod az alkotás során? Ezen kívül használsz esetleg más fejlesztéseket is?
Ezeket, meg ezek módosított formáit.
Az MI alkotásai komoly etikai kérdéseket is felvetnek?
Fel, csakhogy nézzük kicsit differenciáltabban a kérdést. Képzeljünk el egy alkotóművészt, akinek a munkáira megtanították az MI-t, akár akarja, akarta azt a művész, akár nem. Az alkotó bírósági úton eléri, hogy műveit eltávolítsák az anyagból. Ezzel valóban el fog tűnni? Másként fogalmazva, ha Picassót kiszedem a művészettörténetből, a hatása alapján nem lehet pontosan körülírni, meghatározni? Főleg egy olyan rendszer esetében, amelyik az emberi tudáson kívül képes adatokat rendszerezni és keverni?
Ami számomra elképesztő az MI-ben az, hogy az ember képi világát, e képi világ történetének lenyomatát mintegy tárolóként kezeli, vagyis egy olyan kollektív emlékezet foglalata és kezelője, melyben nemcsak festmények és képeslapok, hanem privát emberek fotói, tárgyaiknak lenyomatai is bennfoglaltatnak. Korok, benyomások, emlékek végtelen halmaza.
Lehet Picassót is keresni benne, de lehet, mondjuk, nemlétező boldog emberek fotóit is előhívni a húszas évekből. Olyan emberekéit, akik éppen úgy és ott nem léteztek ugyan, de valahol, valamilyen formában mégis léteztek, hiszen a lenyomatuk részese lett ennek a közös halmaznak. Az pedig, hogy mit szeretnénk látni, nos, az csak az emberi kreativitáson múlik, hiszen az input csakis tőlünk függ.

Az alkotás folyamán minden esetben kontrollálod a véletlenszerűséget?
Kontrollálni szeretném, de nem mindig teszem. Néha jó elengedni az MI kezét, mert izgalmas irányba visz, de azért legtöbbször nagyon is fontos pontosan definiálni azt, amit előhúznék a zsákból. Ez maga az alkotói folyamat.
Borítókép: Szauder Dávid: Tangi in Wonderland (2023) / Binálé Budapest

