AI-konst – kan en robot skapa?

Förlaget 15 november, 2022

Med den snabba utvecklingen av artificiell intelligens står också bildkonstnärer inför helt nya utmaningar – både ekonomiska och filosofiska. Illustratören Karstein Volle har följt debatten om skillnaderna mellan konstverk gjorda av människa och maskin.

UNDER SENASTE MÅNADERNA har en helt ny teknologi som låter artificiell intelligens (AI) omvandla ord till bilder trätt fram. Applikationer som Dall-E 2, MidJourney och Stable Diffusion är de mest kända och frågan är nu om det bara handlar om konst i ett nytt medium, eller något större för vår uppfattning om konst?

Debatten kring AI-konst kan summeras i två reaktioner: dels att alla nu enkelt kan göra konst (coolt!), dels att konstnärer är sura över det (buu!). Jag vill gärna lyfta frågan till en annan nivå: vad innebär det för konsten och konstnärerna om man inte längre kan urskilja AI-genererat från handgjort? Och är bilderna som robotarna framställer verkligen ”bra”? Kan maskiner skapa konst?

Vad innebär det för konsten om man inte kan urskilja AI-genererat från handgjort?

PÅ 1800-TALET, i begynnelsen av den industriella eran, förstörde så kallade ludditer de automatiska vävmaskinerna som kommit in i textilfabrikerna. Och de hade ju rätt i sina farhågor, många förlorade sina jobb och yrken till en spinning jenny. Om tech-forskarna Carl Frey och Michael Osborne har rätt kommer nästan hälften av alla jobb att automatiseras inom 10–20 år. Artificiell intelligens och robotik är snart så utvecklade att rutinmässiga arbetsuppgifter kan ges över till AI-styrda robotar. De är redan vanliga vid bland annat Amazons lagerhallar, de diagnostiserar lungcancer mer exakt än läkare kan och automatöversättningar har gjort språktolkning till ett knapptryck. Med självkörande bilar och långtradare förutspår jag inte bara massarbetslöshet bland chaufförer, utan också en katastrof för Nashville country och trucker music.

AI har potential att ta mänskligheten till en ny utopisk tid av teknologiska framsteg, men välsignelser är sällan entydiga. Ett första problem är att de som investerat mest i AI redan äger stora delar av teknologisektorn, och det är företag som verkligen inte är kända för sitt samhällsansvar. Raison d’être för Alphabet, Tesla, Apple, Meta eller Amazon är ren ekonomisk tillväxt – och gärna obegränsad sådan. Den utsatta sektorn är arbetarna, medan industrialisterna har allt att vinna och mycket lite att förlora på AI-satsningen.

När folk mister sina jobb till robotar är det det allmänna som plockar upp notan, medan företagen som i åratal undvikit att betala skatt sitter kvar med rekordavkastning och utan skyldigheter gentemot någon utom sina aktieägare – som kräver allt högre avkastning.

EN HELT ANNAN fråga är hur vi bemöter AI-konsten och vad den kommer att göra med oss och vårt förhållande till bilder – till vad konst är. Jag har sedan våren aktivt följt med diskussionen om AI-konst på olika chattforum och varit betatestare av både Dall-E och MidJourney. Det är en oerhört fascinerande ny teknologi, men bilderna jag sett folk framställa är samtidigt både imponerande och totala besvikelser. Nej, jag har inga problem med fantasy art, cyborgs, pin-ups eller undersköna kvinnor omgivna av blommor i starka färger. Men det är ingenjörskonst. Tekniken är spännande men resultatet är torrt som knäckebröd.

Maria Turtschaninoff

Arvejord

€33.80 Lägg i varukorg

Ulla-Lena Lundberg

Lyser och lågar

€33.50 Finns som ljud- och e-bok

Jag är själv en allätare när det kommer till kultur. Konceptkonst och östeuropeiska art house-filmer går ner lika bra som skräp- och popkultur, japansk weirdness eller tecknade serier. Jag är heller inte negativ till digital konst i sig, mer entusiastisk, faktiskt. Jag har jobbat med bildkonst på dator sedan farsan kom hem med en Commodore 64 i mitten på åttiotalet och sett tekniken utvecklas med stormsteg. När Adobes Photoshop slog igenom hade konstvärlden en årslång debatt om vad som är äkta foto och inte.

Så det är inte möjligheten att framställa bilder med teknologiska hjälpmedel som är problemet. Det är människorna som använder teknologin som är det. I en intervju för tidningen Journalisti citerades jag nyligen för att sagt att ”de flesta människor besitter en begränsad visuell fantasi”. Ja, jag framstod som en elitistisk snobb men det är också sant. Visst har vi alla en fantasiförmåga, men det att alla har en förmåga, betyder inte att den är lika för alla. Jag kan också löpa, men inte som Usain Bolt.

FÖR NÅGRA ÅR sedan halkade jag på isen och landade på min teckningsarm, den vänstra. Katastrof. Armen var obrukbar men deadlines och hyresvärden väntar inte. Så jag tränade upp högerarmen och märkte att skisserna, skakiga som de var, inte såg extremt annorlunda ut. Det finns tydligen ett huvud mellan de två armarna.

Före hantverket kommer idéerna. Fantasi är något som måste bearbetas och tränas upp. Som konstnär och grafiker lär man sig dekonstruktera sina idéer. Att analysera saker en i taget är en nödvändig process för att förverkliga saker bortom fantasin. Alla konstnärer utvecklar sin egen unika process genom åratal av intryck, övning, ambition, evig nyfikenhet, kärlek till formen och viljan att uttrycka sig. Det inte magi, det är ett hantverk man lär sig.

Att kalla konstnärlighet för en gåva är att nedvärdera åratal av arbete, skolning och övning.

”Magi” för mig är hur en värmepump eller mobiltelefon fungerar. Att framställa tilltalande bilder är kanske lite som magi för andra. De kallar det ofta talang eller en gåva, men trots att de menar väl nedvärderar de samtidigt de år av arbete som krävts för att komma upp till proffsnivån. Jag tror idén om medfödd talang i vis mån bidragit till att folk i högre grad accepterar tanken att bilder kommer till på något magiskt – eller automatiskt – vis. Men att skapa bilder är ett arbetsdrygt hantverk – och det är det hantverk som AI nu lovar att utföra enkelt och snabbt. Det är det som får AI att verka ”magiskt”.

ALLA SOM HAR pulat lite med programmering vet att datorer är bland de dummaste tingesterna på jorden. De utför det du ber dem om, men bara exakt det du ber dem om. AI:s framsteg gentemot traditionella datorer är att AI fattar rudimentär semantik dvs. vanligt språk. Med andra ord ”förstår” den vad du säger – och ibland till och med vad du menar.

För att AI ska kunna skapa bilder av ord har man tränat upp ett script till att känna igen visuella markörer. Google har bland annat använt captcha-teknologin, som tvingar folk att identifiera saker på bilder som bevis för att man är mänsklig, för att träna upp AI:ns förmåga att känna igen former i bilder. På så vis ”fattar” scriptet semantik. På så vis börjar maskinen ”förstå” bilder. Hjälpligt i varje fall.

Men som bildskapare skaver det, och här kommer det andra stora problemet med AI-konst. Metoden är helt fel. När man gör en illustration startar man oftast med en mental bild som man strävar mot, och det verbala, beskrivningen av den, kommer i andra hand. Bildvärlden är alltid större än ordens värld. Tusen mot ett, som man brukar säga. Ord är faktiskt rätt fattiga och klumpiga, och konstnärer jobbar därför naturligt utifrån en nonverbal visuell kunnighet som fyller glappen dit språket inte kan nå. Bilder existerar inte som ersättning för text, de är det primära.

För dem som är tvåspråkiga är det här säkert bekant: det blir fel när man tänker en mening på ett språk, översätter den rakt av och sen uttalar meningen. Man måste tänka i det språk man vill tala om man ska göra det väl, och konstnärens språk är det visuella. Att som AI-apparna gör inleda skapandet av en bild med ord, är att klättra med röven före upp i trädet, som finnen så visuellt uttrycker det.

Att som AI-apparna gör inleda skapandet av en bild med ord, är att klättra med röven före upp i trädet.

DET TREDJE PROBLEMET – och det är ett riktigt stort ett – är att AI-algoritmerna har blivit upptränade via redan existerande konst. Man kunde säga att AI aldrig skapar något nytt, utan bara mixar ihop olika element ur sin existerande bildbank. Sen spottar den ut något som vagt påminner om det du bad den framställa. Konstnärer vars bilder har använts för att träna upp scriptet blev heller aldrig tillfrågade om de ville låta AI stjäla deras bilder och lägga dem på minnet. Vi som jobbar med bilder säljer vanligen inte själva bilderna. Som upphovsman äger man i stället upphovsrätten till dem, och det man säljer är alltså rätten att reproducera ens alster. Den upphovsrätten har här kapats utan kompensation.

Det mest välkända exemplet är den polska målaren Greg Rutowski som specialiserat sig på fantasy art – ni vet, episka slagfält, drakar och slott, eld och rök. Rutowskis stil är mycket populär bland folk som gillar att programmera och hans konst har därför använts till att träna AI. Om du nu Google-söker på hans namn får du upp bilder som ser ut som Rutowskis men som han aldrig har gjort. Hans specifika stil har noggrant imiterats av AI och på så vis förfalskas hans konst i industriell skala, medan hans egna originalverk drunknar bland kopiorna. Och allt sker bortom hans kontroll och utan hans medgivande. När massproducerade kopior fyller etern, vem bryr sig längre om originalet, så länge det ser ”bra nog” ut? Scriptet är gratis men konstnären behöver äta och betala hyran.

Johanna Holmström

Handbok i klardrömmar

€33.80 Lägg i varukorg

Sara Ehnholm Hielm

Hur jag gick på bio och aldrig kom tillbaka

€30.40 Lägg i varukorg

Inom 3D-tekniken talar man om The Uncanny Valley, som är strävan – och svårigheten i – att modellera och animera ett realistiskt människoansikte. Problemet är att stora delar av vårt synsinne är uppbundet av att läsa av människoansikten, så det räcker att någon subtil, nästan omärklig detalj i ett ansikte är fel, för att vi ska reagera med avsky. Det är som att se en död kropp som rör sig. Att som bildkonstnär utsättas för den visuella materia som AI-generatorer nu sköljer över oss känns just så.

Det hela påminner om visuellt Dunning Kruger-symptom: om man kan bara lite om någonting, så fattar man inte hur mycket mer det finns att kunna. Man vet så litet att man tror man vet allt. Och om man är tillräckligt dålig på något, är det omöjligt att förstå hur dålig man egentligen är.

TONEN PÅ AI-FORUMEN har ändrats snabbt. Från upptäckarglädjen och den inledande enorma och kaotiska produktiviteten har dessa nya ”konstnärer” efter bara ett par veckors promptskrivande börjat utveckla alldeles monstruösa egon. Promptskribenter jämför sig med popkonstnärer som Jeff Koons eller Andy Warhol, och att världen inte inser briljansen hos deras autogenererade bilder på sci-fi-jungfrur i solnedgångar är en orätt i klass med hungersnöden i världen. Logiken här är att Koons och Warhols arbetsmetoder anses validera AI-konsten, eftersom de inte heller alltid utförde hela processen själva utan hade hjälp av assistenter. Men varför sluta där – om AI-konstnärerna läst sin konsthistoria hade de vetat att också klassiska mästare som Rubens, Michelangelo, da Vinci och Rembrandt använde assistenter. Okunskap blandat med självhävdelse är ingen vacker kombo.

Att kalla sig konstnär när man skrivit in en AI-prompt är som att kalla sig kock när man beställt en pizza.

I vissa fall har snacket degenererat till ren avund och hat mot traditionella konstnärer. Den sårade stoltheten hos AI-folket är tydlig när konstvärlden vägrar acceptera dessa nykläckta, självutnämnda genier in i finrummen. Men att kalla sig konstnär för att man skrivit in en prompt är som att kalla sig för kock när man beställt en pizza.

BORDE KONSTNÄRER FÅ betalt för sitt arbete? Jag överdriver förstås, men kommer samtidigt bra ihåg hur debatten såg ut för tjugo år sedan då mp3:orna kom och Napster hade sin storhetstid: ungarna som rippade miljarder låtar från peer-to-peer-servrar och delade dem vidare blev hjältar, medan skivbolagen, musikförläggarna och Lars Ulrich som försökte få dem att respektera upphovsrätten också i den nya digitala verkligheten, blev bovarna i dramat.

Snabbspola framåt och de multinationella musikbolagen står fortfarande kvar, medan mindre artister har tvingats bli entreprenör för att få kunna fortsätta skapa. Skivförsäljningen är så gott som borta och väldigt, väldigt få artister kan betala hyran genom intäkter från streaming. Den teknologin hjälpte mest en viss Daniel Ek att bli miljardär genom att betala ut skrattretande låga royalties till dem som skapar innehållet på hans Spotify.

Musiker i gemen blev inte heller hjälpta av alla talangtävlingar som uppstod på tv. De spred närmast idéen att allmänheten gör artisterna en tjänst bara genom att lyssna på deras musik. Synlighet, uppmärksamhet och exponering blev det viktigaste. Att konstnärer ska vara tacksamma för sin publik är helt i ordning, men att det gått så här långt är bara helt vrickat.

Jag var själv musiker i liten skala under den här tiden och det var lätt att se skillnaden som ett par år gjorde: plötsligt började konsertarrangörer kräva hyra för scenen av banden. Pay-to-play som tidigare varit ett dåligt skämt var nu allvar. Om vi börjar se en liknande utveckling inom bildbranschen och debatten om AI vinklas fel, finns det risk att konstnärerna åter blir bovarna, medan storbolag som Alphabet och Meta kan rida ut stormen. De kommer att uppfattas stå på konsumentens sida mot de från verkligheten fjärmade konstnärerna som inte fattar hur saker numera funkar – och fortfarande insisterar på att få betalt.

Om debatten kring AI och konst vinklas fel, finns det risk att konstnärer som vill ha betalt för sitt arbete blir bovarna i dramat.

Bildskapande är ett yrke som samhället behöver men som historiskt sett alltid haft svårt att kontrollera och hävda sina rättigheter till skälig inkomst. När illustratörer gemensamt kommer överens om rekommenderade standardersättningar anses man bedriva ”kartellverksamhet”, medan till exempel skådespelare, fotografer och författare m.fl. har haft liknande standarder på plats i årtionden. Konstnärer borde antingen få bättre skydd för sin intellektuella egendom eller – om uppfattningen är att deras alster ska tillhöra allmänheten – rejält högre ersättningar.

ART DIRECTORS ÄR de som styr bildpolitiken vid publikationer. De leder tidningens visuella uttryck, dess ansikte utåt, och de förväntas ha en expertis som kan lyfta och urskilja produkten och varumärket ur mängden. D:et i AD står för director vilket man inom konstvärlden kan översätta som regissör eller dirigent, men idag går en AD:s uppdrag alltför ofta ut på att bläddra igenom bildbanker på nätet i sökan efter en bild som man inte varit med om att dirigera eller regissera överhuvudtaget.

Budgetar för visuella avdelningar skärs ner konstant och många AD:n kommer säkert att själv börja ta fram bilder med AI, eller köpa dem av Shutterstock och andra leverantörer som tagit till sig de nya teknikerna. Men varför inte ringa upp en riktig grafiker eller fotograf istället, ge en brief till en människa med levande visuell fantasi och få ett originalverk att publicera? AI:n fattar fortfarande inte kontext, överraskning, mångbottnade referenser eller humor, och att brotta fram en hållbar bild via en AI-prompttext innebär att du som AD får spendera timmar på att retuschera den till publiceringsdugligt skick – och där äter du upp din budget i alla fall.

Konstnärer drömde om bilder innan de kunde göra dem. De lärde sig hantverket för att förverkliga dessa drömmar. Idéerna kommer först och konstproffs har en icke-verbal och visuell intelligens som är resultatet av år av engagemang. De producerar något som du som AD alltid kan vara stolt över att trycka.

TILL SIST EN mer positiv syn på utvecklingen. En enorm aktivitet pågår nu på AI-forumen och den kommer bara att öka. Folk har redan publicerat hela serieromaner, musikvideor, rotoskoperade animationer och massor annat. Tarotkort, affischkonst, surrealism – kreativiteten är gränslös. Också intresset för konsthistoria och -teori inom har ökat, och många AI-kreatörer berättar att deras intresse för den tradition de vill verka inom väckts av att nu kunna göra bilder ”själv”. Promptskrivarna blir bättre och mer professionella.

Behovet av bilder växer konstant, och AI kommer att ha en stor roll i att möta efterfrågan.

Behovet av bilder växer konstant, inte minst på olika streamingplattformer som Netflix, som konstant behöver nytt bildmaterial. Det är redan kris i filmindustrin och att AI kommer hjälpa till där är snart lika självklart som att man använder CGI dvs. datagrafik. Inom arbetsintensiva jobb som storyboarding kommer AI sannolikt att få en stor roll, och AI-genererade mood boards kommer också att bli vanliga i starten av en designprocess. Jag har själv använt AI för att få igång idéprocesser och färska perspektiv.

AI är ett kraftfullt verktyg, men om du tror det kan skapa saker helt själv och automatiskt, då förstår du ännu mycket lite av hur bilder fungerar. Och vad konst är.

____________

Karstein Volle (f. 1974) är illustratör, musiker och konstlärare bosatt i Helsingfors. Han har gett ut flera musik- och seriealbum. För FRLGT ritade Karstein originalserien Volles värld under pandemiåret 2020. (Illustration: Karstein Volle)