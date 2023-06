Stefanie Sun, star di musica mandopop (la scena musicale pop in cinese mandarino) originaria di Singapore, è una delle cantanti più amate in Cina. Negli ultimi vent’anni ha venduto milioni di dischi e ha saputo costruirsi un enorme seguito in tutto il paese. Ma l’ultimo album di Sun, che ha 47 anni, risale al 2017. Così i suoi fan hanno pensato che era tempo di intervenire.

Zheng, un informatico di Xiamen, città nel sudest della Cina, appassionato della musica di Sun, ha caricato più di cento canzoni dell’artista in un software open source in grado di replicare la voce umana chiamato So-Vits-Svc, insegnandogli poi a eseguire qualsiasi canzone con la voce di Sun.

Cover d’autore

“Volevo sentirla cantare altre canzoni”, dice Zheng, che rivela solo il suo cognome per evitare problemi legali. Ha usato il modello per generare una serie di cover “rivisitate” da Sun, dal classico folk Five hundred miles a Rolling in the deep di Adele. “La voce è incredibilmente simile. Inoltre l’intelligenza artificiale (ai) canta in modo più regolare rispetto a Sun”, spiega Zheng.

La crescita di software open source – So-Vits-Svc è uno dei tanti – condivisi dagli sviluppatori cinesi su piattaforme come Git­Hub, ha permesso agli internauti di perfezionare i modelli capaci di generare deep­fake, falsi iperrealistici che imitano le voci delle celebrità. Da Singapore alla Spagna, i software creati in Cina sono stati usati per resuscitare artisti scomparsi, prendere in giro i politici e produrre canzoni con le voci di Kanye West, Taylor Swift e Donald Trump.

Ma la proliferazione di questi programmi in grado di clonare le voci ha attirato l’attenzione delle autorità e dell’industria discografica. In Cina i mezzi d’informazione statali hanno avvertito i creatori di “canzoni ai” di non violare il copyright. Dopo che un brano generato dall’intelligenza artificiale imitando le voci di Drake e The Weeknd è diventato virale, la Universal Music Group, tra le più grandi case discografiche del pianeta, ha dichiarato che le canzoni deep­fake sono una forma di “frode” e una minaccia per la creatività umana. So-Vits-Svc, uno dei più popolari programmi open source usati per generare canzoni deep­fake, è stato creato nel 2022 da Rcell, un informatico che lavora a Bilibili, un sito cinese per la condivisione dei video. Sui suoi profili social, Rcell ha spiegato di aver usato il programma per ricreare la voce di uno youtuber virtuale giapponese, o Vtuber. L’anno scorso Rcell ha condiviso il suo programma su Git­Hub, e da allora il software si è diffuso in Cina e all’estero. A maggio di quest’anno, “Ai Stefanie Sun” era tra le tendenze sui social network cinesi, dove le sue cover sono state riprodotte milioni di volte, al punto che secondo molti utenti dovrebbe essere premiata come “miglior cantante dell’anno”.

World robot conference, Pechino, agosto 2022 (Lintao Zhang, Getty)

“Non mi aspettavo che facesse così tanto scalpore, sono rimasto sconvolto”, spiega Jonathan Huang, uno studente delle superiori di Taichung, sull’isola di Taiwan. Huang racconta di aver tradotto in inglese il manuale d’istruzioni di So-Vits-Svc e di averlo pubblicato su Git­Hub, rendendo il programma ancora più accessibile agli utenti occidentali.

Alcuni sviluppatori temono le implicazioni legali. A marzo, Rcell ha annunciato su Bilibili di aver ritirato il programma da Git­Hub perché gli utenti se ne servivano per clonare la voce dei personaggi famosi. “Qualsiasi cosa accadrà, io non c’entro più nulla”, ha scritto il programmatore. “Sono convinto che nessuno dovrebbe usare i miei progetti per attività politicamente delicate”. Rcell non ha accettato di farsi intervistare. Successivamente il codice sorgente So-Vits-Svc è stato ripubblicato sulla piattaforma da altri sviluppatori, con l’invito a rispettare le leggi cinesi.

Cause e conseguenze

In base alle nuove regole sull’intelligenza artificiale introdotte dal governo di Pechino, chiunque pubblichi contenuti deep­fake nel paese rischia non soltanto una denuncia per violazione del copyright, ma anche un processo penale. A maggio un uomo è stato arrestato con l’accusa di aver utilizzato ChatGpt per generare una notizia falsa su un incidente ferroviario. Le nuove leggi cinesi obbligano i fornitori di servizi a fare luce sui contenuti che potrebbero confondere il pubblico, ma secondo Helen Toner, del Center for security and emerging technology dell’università di Georgetown, negli Stati Uniti, non è chiaro se anche i programmatori possono essere ritenuti responsabili.

“Sarei sorpresa se i funzionari cinesi decidessero che chiunque abbia avuto un ruolo nello sviluppo di questi software può essere incriminato”, spiega Toner. “Ma immagino che possano portare a processo chi continua a diffondere strumenti open source largamente usati in Cina”. Alcuni sostenitori dell’intelligenza artificiale non hanno rinunciato a creare programmi per i deep­fake. Un esperto di algoritmi di 27 anni che vive a Shanghai e ha chiesto di essere identificato soltanto con il suo nickname su Bilibili, Flowers don’t cry, ne ha messo a punto uno chiamato Rvc. Flowers don’t cry spiega che rispetto a So-Vits-Svc, il suo programma ha bisogno di meno materiale originale per clonare una voce. Rvc è già stato usato per creare deep­fake di Kanye West e Michael Jackson.

“Non posso controllare il modo in cui le persone usano il software”, spiega il ragazzo, aggiungendo di non avere paura dei rischi legali della sua attività. “Se non lo avessi reso open source, lo avrebbe fatto sicuramente qualcun altro. Non si può fermare lo sviluppo della tecnologia”.

Stefanie Sun, dal canto suo, accetta con rassegnazione il fatto che la sua voce generata dall’intelligenza artificiale sia ormai più popolare di quella originale. In un post pubblicato il 23 maggio sul suo blog, Sun ha dichiarato che per gli esseri umani è impossibile competere con l’intelligenza artificiale.

“Come si fa a combattere contro qualcuno che pubblica un album nel giro di pochi minuti? I miei fan hanno accettato che ormai sono una cantante del passato, irrilevante, mentre la mia imitazione generata dall’intel­ligenza artificiale è sulla cresta dell’onda”. ◆ as

