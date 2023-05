Quando i due hanno contattato la fondatrice di VocaliD Rupal Patel, la patologa e logopedista gli ha spiegato che potevano ricostruire digitalmente la voce di Joe a condizione che lui riuscisse a “metterla in banca” prima dell’intervento. Voleva dire che Joe avrebbe dovuto registrare qualche migliaio di frasi messe a punto da VocaliD per catturare tutti i fonemi dell’inglese. Lui ha promesso di provarci. Ma dopo aver registrato alcune centinaia di frasi si è reso conto che era un compito immane e si è fermato per qualche giorno. “Era la mia ultima settimana di libertà e avevo un sacco di cose da fare, persone da vedere, vita da vivere (e bistecche da mangiare)”, mi ha scritto.

Poco prima di girare quel video, l’amico regista gli aveva dato una notizia interessante: aveva scoperto una ditta vicino a Boston, la VocaliD, che creava voci digitali su misura per le persone che parlavano con l’aiuto di dispositivi. La ditta avrebbe potuto usare registrazioni della voce di Joe per ricrearla al computer, così che lui potesse tenerla e usarla per sempre.

Parlando rivolto alla videocamera, Joe cerca con difficoltà ma sinceramente di esprimere quello che prova all’idea di perdere per sempre la possibilità di parlare. “Io non sono quello che si dice un vanitoso”, afferma sommessamente. “Di solito dopo essermi alzato passano ore prima che mi guardi allo specchio. Di certe cose non m’importa niente”. Fa un attimo di pausa. “Però sono umano”, riprende. “E l’idea che il mio aspetto o la mia voce non saranno più gli stessi… è terrificante”. Deglutisce. “E poi c’è il mio lavoro, la mia vita, tutto ruota intorno alla comunicazione, al parlare. Adoro conversare”, dice con trasporto, sorridendo esitante. “Ho tante cose da dire”.

Nel video la pronuncia di Joe comincia già a sembrare incerta: incespica un po’ e per reggere lo sforzo di parlare deve continuamente bere piccoli sorsi d’acqua e respirare profondamente. Indossa un pullover nero con lo scollo a V e siede vicino a una finestra che offre una vista di Londra al crepuscolo. È pallido, ha gli occhi azzurri infossati, i capelli arruffati e una barba di tre giorni. Sembra un po’ sofferente, un po’ triste e un po’ infastidito, come se non apprezzasse di essere al centro dell’attenzione. China il capo di continuo e distoglie lo sguardo, oppure spara battute. Quando il suo amico gli chiede di dire che giorno è, Joe fa una smorfia e risponde in tono asciutto e formale: “Oggi, credo, è il 24 febbraio dell’anno del Signore 2017”.

Un’idea terrificante Una settimana prima dell’operazione, Joe si è reso conto che forse non avrebbe potuto parlare mai più, e anche in caso contrario la sua voce non sarebbe più stata la sua. È stato preso dal panico. Sapendo che stava per perdere una parte enorme della sua identità, Joe ha chiesto a un amico regista d’intervistarlo e filmare il tutto; così avrebbe conservato per sempre una registrazione della sua voce.

Gli oncologi del Guy’s hanno nuovamente rassicurato Joe: il rigonfiamento tumorale era piccolo, inoltre il cancro alla lingua di solito parte dalla superficie e cresce verso l’interno. Probabilmente era possibile asportare quel bozzetto senza danneggiare troppo il resto della lingua. Avrebbero fatto una risonanza magnetica per accertarsi che non ci fosse nessuna seria proliferazione verso l’interno e poi avrebbero programmato l’intervento.

Sono sicuro che non è niente, gli ha detto lo specialista, le sue risposte alle domande del mio questionario sono tutte negative. Ma facciamo una biopsia, non si sa mai.

Sono certo che non è niente, gli ha detto il medico. Lei non fuma e ha solo 31 anni. Comunque consulti uno specialista, non si sa mai.

Joe era sicuro che non fosse niente: non fumava e nella sua famiglia non c’erano precedenti di tumori maligni. Però avrebbe prenotato una visita, non si sa mai.

Nel novembre del 2016 Joe Morris, cineasta londinese di 31 anni, si è accorto di avere una piaga sulla lingua. Ha pensato di essersela morsa nel sonno e non ci ha pensato più. Poi però, durante le vacanze di fine anno, ha notato che la piaga era ancora lì. È andato su Google e ha digitato “un taglio sulla lingua che non guarisce”, e dopo aver sfogliato pagine e pagine d’informazioni mediche sul cancro della bocca, ha deciso di telefonare al medico.

◆ La banca di VocaliD raccoglie donazioni in inglese. Per donare la propria voce basta creare un account sul sito vocalid.co e seguire le istruzioni. Si tratta sostanzialmente di registrare la propria voce mentre si leggono frasi tratte da testi in inglese di categorie a scelta come poesia, favole e miti, scienza, romanzi e biografie, fantasy e fantascienza, storia. Un esempio di una delle frasi da leggere: The crow lifted up her head and began to caw her best, but the moment she opened her mouth the piece of cheese fell to the ground, only to be snapped up by Master Fox (il corvo alzò la testa e cominciò a gracchiare al suo meglio, ma quando aprì il becco il pezzo di formaggio cadde e la volpe lo azzannò).

Il critico cinematografico Roger Ebert, che per un tumore ha dovuto farsi asportare la mandibola, descriveva così, nel 2009, la frustrazione di dover usare una di queste voci generiche: “Mi sembra di essere Robby il robot. Esprimersi in modo efficace e dare un’intonazione è impossibile”. Era stufo di essere ignorato nelle conversazioni con altre persone o di fare la figura dello scemo del villaggio. “A proposito di questi desideri, molti di noi dicono: abbiamo mandato l’uomo sulla Luna, perché io non posso avere una voce mia?”.

“Provi a entrare in un’aula piena di bambini con disturbi della voce”, mi ha detto Rupal Patel della VocaliD, “e sentirà sempre la stessa voce”. Dieci anni prima, mentre partecipava a una conferenza, Patel si era imbattuta in una bambina e in un uomo di cinquant’anni passati che comunicavano per mezzo dei loro apparecchi. Parlavano con la stessa voce di maschio adulto e lei era rimasta inorridita. “Questo significa semplicemente continuare a disumanizzare persone a cui già manca una voce per parlare”, mi ha detto.

Ma la “voce di Stephen Hawking” non appartiene solo a lui. È usata anche da bambine, anziani, persone di ogni appartenenza etnica. È una delle caratteristiche più strane del mondo delle persone che usano l’Aac: sono milioni ma condividono un numero di voci limitato. Oggi, è vero, c’è più varietà di prima; ma le opzioni facilmente accessibili sono solo poche decine, e per lo più sono voci di maschio adulto.

Voce e identità Il caso di Stephen Hawking è uno degli esempi più lampanti del modo in cui la voce dà forma alla nostra identità. Anche se all’inizio la qualità robotica della sua voce digitale (e quell’accento americano) gli suonavano estranei, in seguito si sono trasformati in un tratto distintivo. In altre parole, Hawking si è ricreato adattandosi alla nuova voce, al punto che anni dopo, davanti alla possibilità di usare una voce nuova, più armoniosa, più simile a quella umana – e con l’accento britannico – non l’ha voluta. Ormai, la “sua” voce era quella.

La teoria del tutto, il film sulla vita di Stephen Hawking uscito nel 2014, illustra crudamente la perdita a cui questa tecnologia cerca di rimediare. Quando Hawking e la sua prima moglie Jane sentono per la prima volta quella che sarà la nuova voce di lui, ammutoliscono. Dopo un attimo, Jane avanza timidamente un’obiezione: “Ma ha l’accento americano…”. Nel film si tratta di un momento comico, ma nella realtà è un vero e proprio trauma. La nostra voce contiene informazioni che permettono agli altri di conoscerci – la nostra età, il sesso, la nazionalità, la città di origine, la personalità, l’umore – ma anche quelle che consentono a noi stessi di farlo. Quando la tua voce non è più britannica, quale parte della tua anglofonia perdi?

Oggi l’Aac comprende spesso dispositivi come quello reso famoso da Stephen Hawking, cioè un piccolo computer o tablet che dà un suono alle le parole digitate dal paziente. Prima che fosse inventato, nel 1969, il primo di questi moderni dispositivi per la comunicazione text-to-speech (dal testo scritto alla parola), i pazienti affetti da disturbi muscolari o vocali potevano usare solo delle macchine per scrivere speciali, dette sip-and-puff (bevi e soffia), che si azionavano inspirando ed espirando attraverso una cannuccia. Quando Hawking cominciò a usare un dispositivo speciale, nel 1986, la tecnologia Aac aveva fatto notevoli passi avanti. Il programma di cui lui si serviva si chiamava Equalizer e gli permetteva di selezionare parole o intere frasi semplicemente premendo un tasto su un computer portatile, e in seguito su un computer ancora più piccolo montato sulla sua sedia a rotelle.

Negli Stati Uniti più di due milioni di persone hanno attualmente bisogno di metodi Aac (la sigla inglese per “comunicazione aumentativa e alternativa”) digitali, che aiutano a compensare i deficit di linguaggio. Secondo uno studio condotto nel 2008 da Scope, un’organizzazione benefica per persone con disabilità, l’1 per cento della popolazione nel Regno Unito usa o ha bisogno dell’Aac.

Sorprende quanto siano numerosi i modi in cui il potere della parola può essere compromesso: dai disturbi come la balbuzie e l’aprassia (confusione delle sillabe) alle malattie neuromotorie e alla paralisi cerebrale, che privano il paziente del controllo muscolare necessario per articolare le parole, fino alle lesioni cerebrali traumatiche. E ancora: l’ictus, le esportazioni chirurgiche come quella subita da Joe, la sclerosi multipla e infine l’autismo.

Ha ricominciato due giorni prima dell’operazione. Mettere in banca la sua voce è stato un processo lento e doloroso, perché ormai parlare gli provocava un dolore straziante, ma lui tentava di essere il più espressivo possibile. L’ultimo giorno ha registrato fino a tarda notte. Poi, la mattina dopo, è tornato in ospedale e gli hanno asportato la lingua. Così è entrato a far parte di quelli che non possono più parlare, almeno nel senso tradizionale del termine.

La tecnologia messa a punto dalla VocaliD funziona così: cattura pochi secondi di suono vocalico (la fonte) dal destinatario e li applica al filtro fornito da un donatore. La combinazione tra i due elementi permette di creare una voce che “appartiene” in larga misura al destinatario. Giocando con i suoi algoritmi, Meltzner è in grado di creare una voce “più calda”, cioè più nasale, oppure più “autorevole”, cioè di registro basso, o invece “più squillante”, cioè ricca di toni alti.

Fonte e filtro Per una voce digitale come questa bisogna scindere due elementi della voce umana che normalmente funzionano come fossero uno solo: la fonte e il filtro. Il termine “fonte” designa le corde vocali, la laringe e i muscoli della gola, cioè le parti anatomiche che producono i suoni quando ridiamo, gridiamo o parliamo. Meltzner mi ha spiegato che la fonte è come un’impronta digitale: “Ciascuna fonte di per sé contiene abbastanza identità da renderla unica”. Invece il “filtro” della voce sono i muscoli (lingua, labbra, faringe eccetera) che trasformano quei suoni in parole distinte e riconoscibili.

Ogni donazione è poi catalogata in una biblioteca delle voci di cui la VocaliD può servirsi quando crea la voce di un cliente. L’azienda offre voci “BeSpoke”, su misura, in cui il suono della voce del cliente si combina con il vocabolario fornito da un donatore. In questo modo un adolescente può usare la voce donata dal fratello oppure quella di un perfetto estraneo tratta dalla banca delle voci, a seconda di quale s’immagina sia più vicina alla sua (clienti come Joe mettono in banca la propria voce per un fine che la VocaliD chiama “lascito vocale”: si registrano per il futuro, e quando arriva il momento, ricevono un file digitale con la loro voce).

È proprio questo il problema che Patel vuole risolvere. Nel 2007 ha cominciato le sue ricerche per ideare una tecnologia che rendesse possibile produrre voci digitali su misura, più adatte agli esseri umani che dovevano rappresentare. Nel 2014 la tecnologia era ormai abbastanza sviluppata per fondare quella che lei e la sua équipe definiscono “la prima banca delle voci al mondo”, una piattaforma online dove chiunque disponga di una connessione internet può “donare” la propria voce registrandosi mentre legge ad alta voce. Il programma contiene storie scritte apposta per catturare tutti i fonemi della lingua inglese. Ai primi donatori era richiesto di caricare 3.487 frasi. Ora il direttore della ricerca alla VocaliD, Geoff Meltzner, è in grado di creare una voce anche solo con mille frasi.

A differenza di quanto succede, mettiamo, nel trapianto di rene, per donare la propria voce di solito ci vuole qualche giorno, e va fatto da svegli. Non servono visite mediche né apparecchiature, salvo un computer e una connessione internet. Quest’inverno, in una giornata di pigrizia, sono rimasta a letto e ho deciso di donare la mia voce. Così mi sono ritrovata protesa in avanti con la bocca incollata al microfono del mio computer, a ripetere: “Quel tiramisù è una cosa pazzesca! Quel tiramisù è una cosa pazzesca!”.

Le frasi da leggere sono tante che di solito uno legge poche ore alla volta e spalma la donazione su giorni e settimane. Nel tentativo di rendere divertente questo lungo e faticoso esercizio, la VocaliD offre la possibilità di leggere testi corrispondenti ai propri interessi: poesia, per esempio, o fantascienza. Le frasi che ho letto io andavano dai proverbi (“Non dire gatto se non ce l’hai nel sacco!”) alle banalità (“L’hai visto su Twitter?”) a cose serie (“Emergenza: qualcuno mi aiuti subito!”). Alcune mi sembravano troppo personali. Donare una parte del proprio corpo è una cosa intima: tocca qualcosa che sentiamo molto profondamente. Ciascuno di noi è un esemplare unico. La voce, poi, è forse un dono intimo come nessun altro. È una cosa fisica e al tempo stesso metafisica; è il messaggero che proviene dal nostro io corporeo e parla al resto del mondo.

Quando è venuto il turno di “Ti voglio bene”, mi ha preso un leggero panico e ho dovuto ripetere la registrazione più volte. Poi ho saputo che altri erano scoppiati a piangere davanti a quelle parole. Che tipo di “ti-voglio-bene” era quello? Dovevo pensare di rivolgermi a un innamorato, a un genitore, a un animale domestico? Dovevo insistere sulla forza di quel sentimento (“Ti voglio bene”) oppure sul suo destinatario (“Voglio bene a te!”)? Dovevo avere il tono imbarazzato del primo “ti voglio bene”, come una timida dichiarazione, oppure il tono di una calorosa conferma, come quando una mamma dà la buonanotte al figlio? Sudata, ho registrato quella frase in un tono che speravo fosse caldo e neutrale, poi l’ho riascoltato e mi è sembrato non troppo rigido, ho chiuso gli occhi e ho cliccato. Era la mia ultima donazione per quel giorno.

Indentificazione inconsapevole

Poco tempo dopo, sono andata a trovare Patel nella sede della VocaliD, nella periferia ovest di Boston. Patel è una donna esile ed energica con gli occhi luminosi, un elegante caschetto di capelli e una dizione perfetta. Mi ha spiegato con passione quanto può essere miracolosa una voce personalizzata per qualcuno che è rimasto a lungo senza voce. Le persone disabili con difficoltà di linguaggio, mi ha spiegato, hanno più probabilità di essere espulse dal mercato del lavoro, isolate socialmente, identificate erroneamente come persone con deficit cognitivi, o semplicemente di diventare invisibili.

Le persone reagiscono alla voce di altre persone con un’attenzione e un’empatia speciali, ma inconsapevolmente tendono a identificare la capacità di parlare con la prontezza mentale. Nel 2010 l’antropologa medica Mary Wickenden ha scritto una tesi sugli utenti adolescenti dell’Aac, intitolata Teenage worlds, different voices (Mondi adolescenti, voci diverse), in cui osserva: “Chi non riesce a parlare può avere difficoltà a dimostrare che pensa… il linguaggio espresso ad alta voce rende ‘più reale’ la nostra soggettività”.

A chi non può parlare viene ricordato di continuo che agli occhi della società lui è “irreale”. Delle sette voci che le VocaliD ha completato nel primo anno di attività, sei erano destinate a bambini o adolescenti colpiti da paralisi cerebrale, molti dei quali si lagnavano perché gli estranei tendevano o a ignorarli completamente, rivolgendo domande o commenti ai loro genitori, o a parlargli come fossero dei lattanti.

Le tecnologie type-to-talk (dalla parola digitata a quella parlata) sono molto varie a seconda delle esigenze dell’utente. Per i pazienti che hanno un buon controllo muscolare delle dita è semplice: basta digitare le parole su una tastiera tradizionale, e poi ascoltarle mentre escono da un altoparlante. Più comune è la versione in cui l’utente passa in rassegna su uno schermo una selezione di vocaboli, frasi o simboli e sceglie quelle che gli servono con l’aiuto di una leva o di un pulsante situato vicino all’arto che controlla meglio. Per chi non può usare leve ci sono infine degli schermi che seguono i movimenti oculari e sono programmati per leggere ad alta voce la frase o il simbolo che l’utente ha fissato abbastanza a lungo.

Certo, questi dispositivi possono essere frustranti anche per chi li usa correntemente. L’utente deve spesso aspettare che il cursore passi sopra a una decina di lettere o simboli prima di arrivare a quello che lui sta cercando; e se sbaglia deve aspettare che il cursore faccia tutto il giro e poi riprenda dall’inizio. Fino a poco tempo fa molti dispositivi non contenevano neanche termini o simboli che indicassero i genitali femminili; per cui era difficile parlare apertamente di sesso con un amico o un partner, oppure avvertire l’infermiere di avere un’infezione del tratto urinario o denunciare abusi.

Come si è detto, le voci prefabbricate sono spesso inadatte all’età di chi le usa o sono frustranti perché sembrano appartenere a un robot. Patel mi ha parlato di Sara Young, una sua cliente adolescente per la quale stavano creando una nuova voce. All’inizio Sara si serviva della stessa voce (Heather) del Gps della madre e di certi bancomat. Ma nella classe di Sara c’erano diverse ragazze con disabilità vocali che usavano Heather. Risultato: quando si trovavano in gruppo era difficile distinguere chi diceva cosa, a meno di non guardare da vicino. Come molti suoi coetanei anche Sara giocherellava spesso con le diverse voci del suo apparecchio: provava le diverse opzioni per un paio di giorni oppure, per farsi una risata, parlava con la voce di un maschio adulto, ma era pur sempre frustrante. Quando sono andato a trovarli nel loro ufficio, Patel e Meltzner stavano dando gli ultimi ritocchi alla voce destinata a Sara, che avevano creato usando alcuni suoni tipo “ahhh” registrati da lei in persona, più la voce di un donatore. Speravano di essere pronti per Natale.

Il giorno dopo ho accompagnato Rupal Patel a una fiera tecnologica alla Cotting school di Lexington, nel Massachusetts, una scuola privata per alunni con esigenze speciali, tra cui parecchi clienti della VocaliD. La ditta organizza spesso delle presentazioni nelle scuole, sia per offrire i suoi prodotti a giovanissimi costretti a usare le Aac, sia per reclutare nuovi donatori; le voci di soggetti giovani, infatti, sono molto richieste.

Alla fiera partecipavano alcuni genitori e ragazzi affetti da paralisi cerebrale, compresa Sara. Come tanti giovanissimi colpiti da questa malattia, Sara è eccezionalmente piccola per la sua età, perché per mangiare occorre un controllo muscolare che lei non sempre riesce a esercitare. Sara ha i capelli scuri e ondulati con qualche mèche verdazzurra; quando ci siamo conosciute portava una maglietta a maniche lunghe rosa chiaro; la borsa appesa alla sua sedia a rotelle motorizzata era rosa, e al piede che Sara usa per guidare (l’unico suo arto con un controllo motorio affidabile) portava una scarpa da ginnastica, anche quella rosa.

Come succede spesso alle persone che hanno disturbi motori e muscolari, i movimenti di Sara sono spastici. Quando la flette, la lingua ogni tanto le esce di bocca; la testa gira a destra e a sinistra senza controllo; le braccia si accartocciano e si ridistendono come foglie. Per mangiare, farsi la doccia e andare al bagno deve essere aiutata. Per bere usa cannucce di silicone, perché quando succhia le viene da mordere, e siccome non controlla quel movimento, distrugge le cannucce normali. Prima che i genitori scoprissero le cannucce di silicone, le facevano usare i tubicini di plastica che si usano negli acquari. Sara usa il piede sinistro per fare i compiti sull’iPad e per disegnare, con l’aiuto di evidenziatori e nastro adesivo. Per parlare si serve di un dispositivo Aac montato sulla sedia a rotelle, che scrive, per così dire, sotto la “dettatura” dei suoi movimenti oculari.

Sara ha l’aspetto di una bambina, ma il suo atteggiamento rivela che è un’adolescente. Teneva ferma la sedia a rotelle ma ogni tanto si trascinava avanti e indietro un po’ svogliatamente, come quando uno si dondola sui talloni. Quando si annoiava, descriveva un piccolo cerchio con la sedia a rotelle. Ha un piercing rosa e azzurro al naso e odia il suo cellulare perché lo giudica superato (mi ha detto: “Blackberry schifezza”). Ha sopracciglia molto marcate e lo sguardo degli occhi scuri, che alza al cielo di continuo, è penetrante e spiritoso. Dato che bravissima a comunicare, Sara è diventata una sorta di ambasciatrice degli altri ragazzi che come lei usano le tecnologie Aac. In occasione della fiera, lei e la madre, Amy, sono salite sul palco e hanno tenuto il discorso di apertura. La prima a prendere la parola è stata proprio Sara, che ha cominciato con alcune frasi introduttive già scritte sul suo apparecchio. Era vero: la sua voce ricordava quella di un bancomat. “Ciao a tutti”, ha detto, “mi chiamo Sara e ho 16 anni. Quando non ho un apparecchio, le persone si rivolgono a me come fossi una bambina piccola oppure parlano a mia mamma. Io a volte sono lenta nel parlare, e quindi loro mi parlano sopra: non riescono ad aspettare che risponda”.

Quanto fosse vera quella descrizione si è visto con chiarezza più avanti, quando Amy e Sara si sono intervistate a vicenda. Alla richiesta di spiegare cosa facesse con l’iPad, Sara ha cominciato a fissare lo schermo, e per via dei movimenti spastici del collo ha dovuto torcere la testa per mantenere lo sguardo fisso all’altezza giusta. Sono passati 30 secondi, poi 60… tutti la guardavano in silenzio. Dopo 1 minuto e mezzo, il computer ha snocciolato questi suoni: “Hwfacebookigsnapchatmusic”. Traduzione di Amy: “Compiti, Facebook, Instagram, Snapchat e musica”. Durante l’intervista durata un’ora, Sara avrà detto sì e no trenta parole. Come capita spesso, la maggior parte del tempo ha parlato Amy, un po’ per non dilungarsi troppo , un po’ perché comunque è sempre Amy a tradurre le espressioni non verbali della figlia. “Per lei è uno sforzo pazzesco”, mi ha spiegato poi Amy. “È vero, noi incoraggiamo le persone a parlare direttamente a lei, ma a volte per rispondere mi guarda come a dire: ‘Puoi parlarci tu?’”.