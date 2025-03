Il 25 marzo 2025 ho registrato sei puntate di un corso sulle intelligenze artificiali generative. Per evitare che il contenuto diventi subito obsoleto, quando registro cerco di essere molto aggiornato sulle novità e di parlare prima di tutto di metodo. Ma chi segue un percorso formativo desidera giustamente anche una parte pratica. Così ho raccontato il metodo che seguo quando uso le ia generative di immagini e video, a partire dall’idea. Ho parlato anche dello strumento per le immagini integrato in ChatGpt (lo uso, per esempio, per generare il bradipo umanizzato Jon Slow, mascotte della mia newsletter The slow journalist ).

Ho caricato nel modello una schermata dell’inizio della newsletter, poi ho messo una mia foto in versione jedi, che ho fatto a parte sempre dentro al modello e quindi ho chiesto di rappresentare in un’immagine iperrealistica la newsletter su una rivista cartacea appoggiata su una scrivania e la foto sfocata sullo sfondo, aggiungendo una libreria, anch’essa fuori fuoco. Il risultato si poteva sicuramente migliorare, ma ho voluto usare comunque questa immagine perché, con le sue imperfezioni, serve a mostrare contemporaneamente possibilità e limiti. E a ricordarci che la componente di integrazione fra il lavoro umano e quello della macchina farà sempre la differenza.

Queste sono, letteralmente, tecnologie di frontiera e si fa davvero fatica a scegliere lo strumento giusto. Ma cos’è cambiato esattamente, in questo caso? 4o è molto più potente del suo predecessore Dall-e. Ha una maggiore precisione nella composizione: proporzioni e dettagli anatomici risultano generalmente più coerenti; è in grado di integrare meglio il testo nelle immagini: nei biglietti d’invito o contesti dove sono richieste scritte corpose, il modello fornisce risultati più leggibili e meno deformati. L’immagine che illustra questa newsletter è uno dei miei test. Ci sono troppe parole e quindi il modello commette ancora errori di rielaborazione, ma il processo di creazione è stato molto facile.

Quello che mi è successo non è solo un aneddoto personale, ma un esempio da tenere presente quando si parla dell’adozione delle intelligenze artificiali generative. Se un paio di puntate registrate di un corso possono sembrare una perdita di poco conto, un investimento su software molto costosi senza aver ben chiaro come e perché usarli può essere un problema serio.

Lo strumento sembra non avere più certe restrizioni sul copyright – a meno che questa versione così libera non sia giusto un inizio per poi rientrare nei ranghi e in assenza di conferme su eventuali accordi –, sull’uso di fattezze di persone reali, anche famose, e su alcuni tipi di scene, pur rimanendo piuttosto puritano su temi legati a sesso e violenza.Può mettere un logo – anche quello di un marchio famoso – sulle immagini, cosa che Dall-e non era in grado di fare.

Può lavorare molto bene in termini di rielaborazione di un’immagine generata. Funziona bene con la coerenza dei personaggi, cosa che lo rende adatto a creare storyboard, per esempio. Infine, essendo integrato in ChatGpt, consente anche di lavorare dialogando come si è fatto finora con la macchina e poi di realizzare illustrazioni a partire dalla conversazione stessa.

Ho fatto parecchi esperimenti per raccontare 4o Image Generation in maniera visiva: è quasi sempre la cosa più efficace, con questo tipo di strumenti.

Insieme all’innovazione sono arrivate le polemiche. Per esempio, il nuovo modello è in grado di trasformare un’immagine in un’equivalente che ricorda lo stile di Studio Ghibli, lo studio di film d’animazione giapponese fondato nel 1985 a Tokyo da Hayao Miyazaki, Isao Takahata, Toshio Suzuki e Yasuyoshi Tokuma. Molte testate giornalistiche – 404 all’estero, Open in Italia, per esempio – hanno ricordato quindi una vecchia dichiarazione di Miyazaki, che però va messa nel giusto contesto.