Quando nel 2017 Google lanciò Deep dream, il generatore di immagini che sembrava scorgere cani psichedelici ovunque, la reazione della rete fu di curiosità e divertimento: di inquietudini se ne videro poche, ma a qualcuno venne naturale essere quanto meno turbato da ciò che sarebbe necessariamente successo subito dopo. Era infatti chiaro già da quegli ingenui disegni pieni di cani che sarebbe presto arrivato il momento in cui ci saremmo dovuti confrontare con altri programmi, sempre basati sulla tecnologia delle reti neurali, in grado di immaginare e disegnare in un attimo delle illustrazioni di qualità sufficiente (e non necessariamente piene di cani, a meno di richieste specifiche dell’utente). Quel momento è adesso. Già la scorsa estate con la diffusione delle versioni beta di programmi d’intelligenza artificiale come Dall-E, Stable Diffusion e Midjourney (quello che per ora dà risultati più efficaci) i social network si erano riempiti di strani disegni, in uno stile ancora un po’ “sgranato” o “sognato” ma immediatamente riconoscibili come qualcosa di nuovo. Erano un modo di prendere confidenza con i software text to image, capaci cioè di trasformare un testo in un’immagine, ovvero di creare immagini in base a istruzioni scritte o dettate. Anche questa volta la prima reazione alla possibilità di usare versioni più avanzate di quei programmi è stata per lo più ludica: ci si è messi a sperimentare, se non proprio a giocare. Illustratori e disegnatori (ma anche scrittori, visto che il primo fumetto “disegnato” da Midjourney è stato pubblicato proprio da chi scrive, e un altro paio sono seguiti) prendono le misure del nuovo strumento. Ma siamo sicuri, si sono chiesti alcuni, che si tratti solo di uno strumento? Francesco D’Isa, artista e filosofo, direttore della rivista L’Indiscreto, la prima a pubblicare immagini e storie realizzate con Midjourney, è uno dei sostenitori più convinti dell’utilità di queste tecnologie per l’arte e della loro natura di strumenti.

Già prima che esplodessero dibattiti e polemiche, D’Isa scriveva che Midjourney e compagnia erano solo degli strumenti e che il paragone più logico da fare era con la fotografia. Anche ai tempi dell’avvento delle prime macchine fotografiche ci fu stupore (se non sgomento) di fronte alla rapidità con cui il nuovo mezzo produceva immagini; anche allora si paventò la fine della pittura e dell’illustrazione per colpa della nuova micidiale tecnologia; anche allora se ne lamentò la facilità d’uso, asserendo che qualcosa in cui “dovevi solo premere un bottone” non sarebbe mai potuta esser considerata un’arte. Sappiamo com’è andata a finire.

“The oil painting of a masked girl posse, in the spring, with fractal platonic solids, in 1890, reminding of Hockney, metaphysics, geometric, fractal, with a touch of Ingres, symbolism, academia painting, old masters, De Chirico, trigonometry”. (Vanni Santoni con Midjourney)

Tuttavia Midjourney, come le altre intelligenze artificiali text to image, presenta alcune ovvie differenze rispetto alla fotografia, a cominciare dal fatto che le immagini si generano per via testuale attraverso il comando “/imagine” (immagina), facendo al software richieste che possono andare dall’estremamente semplice all’estremamente complesso. Si può chiedere a Midjourney (in inglese) “immagina una ragazza” oppure “immagina il dipinto a olio di una banda di ragazze mascherate, in primavera, con solidi platonici frattali, nel 1890, che ricorda Hockney, metafisica, geometrica, frattali, con un tocco di Ingres, simbolismo, pittura accademica, vecchi maestri, De Chirico, trigonometria” (provate anche voi: Midjourney e le altre Ai sono a pagamento ma hanno una versione di prova di facile uso). Gli aggiornamenti sono continui e la qualità dei risultati è sbalorditiva nei generi più svariati, dall’illustrazione fantasy classica alla pittura futurista in acrilico. In molti casi il risultato è indistinguibile da un’opera umana. Il tutto, per di più, avviene in pochi secondi: con un’oretta a disposizione, un bozzettista con una mezza idea in testa può generare letteralmente centinaia di immagini ad alta definizione (solo nel realizzare le mani Midjourney continua ad avere delle difficoltà: negli archivi d’immagini, o dataset, con cui è addestrato il programma difficilmente si vedono mani intere, perché sono sempre nell’atto di afferrare qualcosa, e per questo il software non le “capisce”). Che si sia di fronte a una rivoluzione paragonabile, come portata, all’avvento della fotografia o della grafica digitale, come scrive il programmatore e scrittore Gregorio Magini (già autore di decisive riflessioni sull’uso delle intelligenze artificiali nella produzione di testi), è ormai indubbio. Su come dobbiamo relazionarci a questa rivoluzione, invece, il dibattito è aperto. Forse perché dobbiamo ancora inquadrare pienamente tutte le implicazioni.

Furto d’autore

Per il critico Demetrio Paparoni, intervistato sulla rivista Galápagos da Giulio Spagnol, non ci sono rischi concreti, perché l’artista resterà sempre e solo chi fornisce i comandi alla macchina, anche quando (ed è il caso di Midjourney) una persona che non sa neanche tenere in mano una matita può generare cinquanta Vélazquez in tre minuti. Ben diversa la posizione dell’illustratore e fumettista LRNZ, al secolo Lorenzo Ceccotti, che vede nell’avvento di questi generatori di immagini un grave pericolo per tutte le professioni grafiche. In un articolo più volte aggiornato LRNZ ha raccolto i suoi dubbi sulle nuove tecnologie, non solo artistici o tecnici, ma anche etici: le aziende che producono questi software – e si fanno pagare per usarli – hanno addestrato i loro prodotti raccogliendo in rete miliardi di immagini senza chiedere il permesso a nessuno. Midjourney “conosce” ormai innumerevoli autori viventi e può quindi disegnare nel loro stile (si noti che il dataset non “esiste più” quando si usa il software: dopo l’addestramento l’intelligenza artificiale si muove autonomamente, senza cercare immagini in un qualche database, ma per così dire “immaginandole”). Possiamo quindi permetterci di legittimare questo “furto” (come lo definisce senza mezzi termini LRNZ) di immagini a scopo di profitto? Molti artisti ritengono di no, e infatti su Art Station, un grande portale di illustratori per lo più amatoriali, nelle settimane scorse c’è stata una grande protesta contro l’uso delle intelligenze artificiali. Ci sono poi altre problemi intrinseci alla tecnologia stessa. Uno è l’indistinguibilità. Un’immagine di Midjourney è già in molti casi indistinguibile da quelle realizzate da un essere umano. Questo può ovviamente essere all’origine di truffe (un illustratore che vende come proprie immagini realizzate in pochi secondi con Midjourney), e ci sono già stati casi di concorsi d’arte vinti con opere “A.I. generated”. Questo problema ne racchiude altri, come la possibilità di creare con facilità deepfake (video di persone reali modificati dall’Ai), e potrà trovare una soluzione solo passando per un paradosso: presto solo un’altra intelligenza artificiale potrà riconoscere con certezza un’opera realizzata da un’intelligenza artificiale, proprio come gli androidi di Blade runner. C’è poi la questione dei diritti. Ogni volta che Midjourney genera un’immagine, lo fa solo perché ha potuto usare una dataset di miliardi di immagini. Si potrebbe dire quindi che ogni immagine di Midjourney appartiene per una parte infinitesimale (e proporzionale al numero di opere incluse) a ogni artista presente nel dataset, al quale dovrebbero essere riconosciuti i diritti d’autore, anche se minimi. Inoltre, per ora, non si vedono soluzioni per la richiesta, avanzata da molti autori, di essere esclusi dal dataset: una volta che Midjourney ha imparato, ha imparato… Si può al massimo sperare in un’esclusione nella prossima versione.

“The oil painting of a showdown between noble ladies and masked men, spring breakers, platonic solids, in 1890, metaphysic, geometric, fractal, in the style of Ingres and Bouguereau, symbolist, academia painting, old masters, weird, high lights.”

(Vanni Santoni con Midjourney)

Infine, è difficile stabilire con precisione quanto un’opera generata da un’intelligenza artificiale sia merito del suo “committente”, il prompter, cioè chi digita il testo di partenza e preme il tasto invio. Questa persona è un’artista? Di certo non disegna né dipinge: scrive una stringa di testo (e ciò la rende subito più simile a un programmatore). Cosa sia esattamente, però, ancora non è chiaro. Parrebbe qualcosa a mezzo tra un dj, che mixa brani o basi altrui, e un curatore (o un arredatore), che allestisce una mostra (o arreda una stanza) scegliendo via via tra quello che ha a disposizione; di certo “promptare” è un’arte molto facile: basta una buona infarinatura di cultura artistica e sufficiente buon gusto per generare rapidamente migliaia d’immagini esteticamente soddisfacenti. È probabile che in un futuro prossimo il prompter – con la sua attività di scrittura, valutazione, selezione – pian piano sia considerato un artista. È andata così con la fotografia in seguito all’affinamento delle possibilità del mezzo e alla moltiplicazione degli utenti, un processo che ha progressivamente reso possibile distinguere i semplici amatori dai professionisti e dagli artisti. Ora, “promptare” è difficile quanto cercare qualcosa su Google Images: digiti parole, emergono immagini (e in effetti se qualcuno si ritenesse il loro “autore”, sarebbe da considerare pazzo), ma si sa che nell’arte la tecnica ha perso valore e l’idea è, in fondo, tutto o quasi tutto. Si può, allora, negare che una volta sistemate le immagini in un qualunque ordine narrativo, o una volta selezionate e ricomposte le stesse in un certo modo o contesto, o ancora solo apponendo un titolo a una di esse, non si stia in un certo qual modo “facendo arte”? Difficile. C’è già chi si spinge oltre nell’automatizzazione, come il programmatore e scrittore Massimiliano Geraci, che ha ideato un prompt per istruire ChatGPT – il chatbot lanciato dalla OpenAi, casa produttrice di Dall-E – a produrre a sua volta prompt testuali ideali per Midjourney a partire da un’idea grezza. Al di là di tutto questo, resta il fatto che Midjourney, Dall-E, Stable Diffusion e le altre Ai, pur aprendo nuovi scenari tecnologici e artistici nel nostro mondo, si stanno arricchendo grazie a enormi dataset composti da immagini prese senza chiedere il permesso a nessuno (si potrà obiettare che anche un artista che visita gli Uffizi o il Centre Pompidou “prende senza chiedere”, con gli occhi), e questo sta diventando intollerabile per un numero sempre maggiore di artisti, al punto che alcuni hanno deciso di provare a muoversi per vie politiche e legali. L’azione parte proprio dall’Italia, e ha come capofila di nuovo Ceccotti, assieme a diversi altri nomi noti del fumetto e dell’illustrazione come Sio, Francesco Artibani, Paola Barbato, Elena Casagrande, Manuele Fior e Ariel Vittori. Il piano è quello di un grande crowdfunding (obiettivo 70mila euro, ne sono già stati raccolti più di trentamila) per “sostenere le spese legali necessarie a far regolamentare a livello comunitario europeo il modo in cui queste società raccolgono i loro dati”. Creare quindi, con l’aiuto di uno studio legale specializzato, una regolamentazione europea vincolante per le aziende che producono software per la creazione di immagini. Inoltre è del 13 gennaio la notizia che un trio di artiste – Sarah Andersen, Kelly McKernan, e Karla Ortiz – ha fatto causa a Stability AI (la casa produttrice di Stable Diffusion) e a Midjourney, affermando che le aziende hanno infranto i diritti di milioni di artisti per addestrare i loro software. Pochi giorni dopo è arrivata anche Getty Images. Le loro rivendicazioni avranno successo? Come ci insegna Terminator, più che Blade runner, la vittoria degli umani sulle macchine non è mai cosa scontata. Ma sarebbe davvero una vittoria? Secondo Francesco D’Isa c’è il rischio che si tratti di una battaglia di retroguardia, dagli effetti non necessariamente positivi: “Se le denunce di Getty Images e delle illustratrici avranno successo non elimineranno queste tecnologie dal mercato come sperano alcuni, ma creeranno dei monopoli”, spiega. “Le grandi aziende tecnologiche che possono permettersi di acquistare immensi stock di immagini potranno sviluppare intelligenze artificiali, le altre no”. Non sembra in effetti casuale né che tra chi ha sporto denuncia ci sia il macro-archivio Getty né che tra le tre aziende di software text to image l’unica a non essere stata denunciata sia la OpenAi, che ha alle sue spalle, tra gli altri, la Amazon Web Service e Peter Thiel, già fondatore di PayPal. Un potere economico e politico non indifferente.

Le immagini di questo articolo sono state realizzate da Vanni Santoni con Midjourney. Le didascalie sono i prompt originali inseriti nel programma di intelligenza artificiale per creare le immagini.