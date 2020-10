Secondo Danforth l’analisi dei sentimenti permette ai ricercatori di esaminare una massa enorme di dati che in passato era difficile raccogliere e impossibile studiare. “Nelle scienze sociali tendiamo a misurare elementi semplici, come il prodotto interno lordo. La felicità è un elemento importante che tuttavia è molto difficile da misurare”.

Felicità incommensurabile Oltre a rilevare la temperatura emotiva degli utenti di Twitter, i ricercatori suano l’analisi dei sentimenti per valutare l’andamento dell’opinione pubblica sul cambiamento climatico e per verificare alcune idee molto radicate, per esempio quella secondo cui un accordo minore è più triste di un accordo maggiore (e in quale misura). Le aziende interessate all’umore dei consumatori stanno usando l’analisi dei sentimenti per valutare le recensioni su piattaforme come Yelp. Altre stanno anche misurando lo stato emotivo dei loro dipendenti raccogliendo dati sui social network interni. Questa tecnica potrebbe avere applicazioni in campo medico, per esempio identificando le persone affette da depressione e bisognose d’aiuto.

L’edonometro è uno strumento relativamente recente in un campo in cui ormai da cinquant’anni gli informatici cercano di valutare lo stato emotivo del mondo usando i computer. Per costruirlo, l’informatico dell’Uvm Chris Danforth ha dovuto insegnare a una macchina a capire le emozioni dietro i tweet analizzati (nessun essere umano potrebbe mai leggerli tutti). Questo processo, chiamato analisi del sentimento, ha fatto grandi progressi negli ultimi anni, trovando molteplici applicazioni.

Lo strumento in questione è l’edonometro, un sistema informatizzato per valutare la nostra felicità e la nostra disperazione. L’edonometro lavora notte e giorno sui computer dell’università del Vermont (Uvm), dove analizza circa cinquanta milioni di tweet al giorno per effettuare una lettura rapida dell’umore dell’opinione pubblica. Secondo l’edonometro il 2020 è di gran lunga l’anno peggiore dal 2008, ovvero da quando sono raccolti i dati (all’inizio di marzo è stato raggiunto un record negativo, coincidente con l’esplosione della pandemia di covid-19. Il record è stato stracciato a maggio, dopo l’assassinio di George Floyd).

Qualcuno potrebbe pensare che il primo passo nell’analisi dei sentimenti sia quello di insegnare al computer a capire ciò che gli umani scrivono. Ma gli informatici non sono in grado di farlo. La comprensione del linguaggio è uno dei problemi più complessi nel campo dell’intelligenza artificiale. Tuttavia, all’interno di un testo scritto, esistono segnali emotivi abbondanti che i computer possono riconoscere anche senza capire il significato delle parole.

Il primo approccio dell’analisi dei sentimenti è basato sul conteggio delle parole. Si tratta di un’idea piuttosto semplice: il computer conta il numero di parole positive e sottrae il numero di parole negative. Una misura migliore può essere ottenuta soppesando le parole: il termine “eccellente”, per esempio, veicola un sentimento più intenso rispetto a “buono”. Il peso delle parole è solitamente stabilito da esperti in carne e ossa, e ha un ruolo nella creazione dei dizionari lexicon, quelli che traducono le parole in emoticon (e viceversa) e sono molto usati nell’analisi dei sentimenti.

Ma il conteggio delle parole presenta alcuni problemi. Per esempio ignora l’ordine delle parole, trattando una frase come come una sorta di minestra di termini diversi scollegati tra loro. Considerate questa recensione: “Sono felice che il mio iPhone non abbia niente del mio vecchio e orribile telefono Android”. La frase contiene tre parole negative (niente, vecchio, orribile) e solo una positiva (felice). Un occhio umano riconosce subito che in questo caso vecchio e orribile si riferiscono a un telefono diverso, ma per il computer sembra un giudizio negativo. Il confronto presenta ulteriori difficoltà: cosa significa “non abbia niente”? Significa che il recensore non sta paragonando l’iPhone con il telefono Android? Il linguaggio umano, a volte, può essere molto astruso.

Per risolvere questi problemi gli informatici hanno creato approcci sempre più sofisticati, in modo da escludere il fattore umano dall’analisi. Oggi usano gli algoritmi dell’apprendimento per insegnare a un programma come riconoscere i rapporti tra le parole. Per esempio il computer può imparare che le parole letto e fiume spesso si presentano in relazione l’una con l’altra. Queste associazioni possono offrire indizi sul significato o sul sentimento di fondo di una frase. Se letto si trova nella stessa frase di notte, probabilmente ha un significato diverso.

Far bollire l’oceano

Un passo avanti molto importante in questo settore è arrivato nel 2013, quando Tomas Mikolov di Google Brain ha usato l’apprendimento automatico per convertire ogni parola in una serie di 50-300 numeri, chiamata vettore. I vettori sono come impronte digitali che descrivono una data parola e anche le altre parole che tendono a comparire insieme a essa.

Per ottenere questi vettori, il programma di Mikolov ha analizzato milioni di parole contenute negli articoli di giornale, cercando di prevedere la parola successiva in base a quella che la precedeva. Gli incastri di Mikolov riconoscono i sinonimi: parole come denaro e contante hanno vettori simili. In modo più sottile, gli incastri colgono le analogie elementari – il re è per la regina quello che il ragazzo è per la ragazza, per esempio – anche se non possono definire le parole. È un risultato notevole, considerando che queste analogie facevano parte della valutazione degli esami di ammissione all’università.

Gli incastri di Mikolov sono generati da una rete neurale dotata di un unico livello nascosto. Le reti neurali, modellate grosso modo sul cervello umano, hanno permesso di ottenere grandi progressi nell’apprendimento delle macchine, come dimostra il caso di AlphaGo (un software che ha imparato a giocare una partita di Go meglio del campione mondiale). La rete di Mikolov era deliberatamente poco profonda, in modo da prestarsi a diverse applicazioni, come la traduzione e l’analisi degli argomenti.

Le reti neurali più profonde, con più strati di “corteccia”, possono estrarre da una parola un numero maggiore di informazioni nel contesto di una frase o di un documento specifici. Un compito molto comune è quello di fare analizzare al computer una recensione di un film sull’Internet movie database e chiedergli di prevedere se alla fine il recensore metterà il pollice “giù” o “su”. I primi metodi basati sui lexicon ottenevano risultati accurati circa nel 74 per cento dei casi. I più sofisticati raggiungono l’87 per cento. Le prime reti neurali, create nel 2011, sono arrivate all’89 per cento. Oggi superano il 94 per cento e si avvicinano ai risultati degli esseri umani (l’umorismo e il sarcasmo restano ostacoli difficili da superare, perché le parole scritte possono indicare il sentimento diametralmente opposto a quello espresso dall’autore).