L’algoritmo che scoprirà il prossimo Harry Potter

L’editoria, come le altre industrie culturali, si basa sul successo. Ma la capacità di prevedere il prossimo best seller è ancora un’arte misteriosa, che dipende anche dall’istinto e dall’esperienza. A volte queste facoltà funzionano bene, altre volte meno, soprattutto quando si tratta di scrittori emergenti. J.K. Rowling e John Grisham ricevettero molti rifiuti prima di portare a casa contratti che li hanno fatti conoscere al grande pubblico. Cinquanta sfumature di grigio di E.L. James ha trovato un editore solo dopo che l’autrice l’ha autopubblicato.

Un algoritmo capace di indovinare i libri più venduti con una precisione dell’80 per cento sembra fantascienza. Ma il “bestsellerometro” di cui parla il libro The bestseller code, di Jodie Archer e Matthew L. Jockers, in realtà è poco fantascientifico. L’efficacia dell’algoritmo sarebbe dimostrata dall’aver “previsto” i best seller del New York Times degli ultimi trent’anni.

Nell’aria da molti anni e frutto del lavoro di migliaia di computer, il bestsellerometro è un tentativo di identificare, attraverso i dati, le caratteristiche di una storia di successo, analizzando più di 20mila romanzi.

Ma un algoritmo può catturare la ricchezza e la complessità della letteratura? Cosa potrebbero avere in comune libri di successo così diversi come le letture da spiaggia di James Patterson e romanzi acclamati dalla critica come quelli di Jonathan Franzen? E come fa un computer a dare conto del clima culturale di un’epoca, che costituisce lo sfondo imprescindibile del fascino di un libro?

Ed ecco la domanda: perché leggiamo tutti lo stesso libro?

L’impresa è stata concepita all’università di Stanford intorno al 2008. Matthew Jockers, all’epoca docente al campus di Palo Alto, era un faro nel settore di studi emergente delle “scienze umane digitali”, ossia l’applicazione dell’analisi quantitativa computerizzata ai testi (in seguito avrebbe fondato lo Stanford literary lab). Jodie Archer, appena laureata, era scettica sulla possibilità che un computer potesse dire qualcosa di sostanziale sulla letteratura. Una dimostrazione sull’abilità di un computer nel capire il genere delle opere di Shakespeare, basata sugli indicatori testuali, non contribuì a dissipare i suoi dubbi: era rimasta colpita dallo spettacolo, ma niente di più.

“E allora? Sapevo già che Macbeth era una tragedia”, incalzava Jockers. “Dobbiamo fare una domanda alla quale non riusciamo a rispondere, che ci faccia fare un vero passo in avanti”.

Ed ecco la domanda: “Perché leggiamo tutti lo stesso libro?”.

L’interesse di Archer per questo interrogativo era nato qualche anno prima, quando lavorava come editor alla casa editrice Penguin di Londra, durante la baraonda sul Codice da Vinci di Dan Brown. Il libro era stato stroncato dalla critica, ma aveva avuto un enorme successo di pubblico. Esisteva forse un “carisma testuale”, per usare l’espressione del libro The bestseller code, al quale i lettori rispondevano, magari senza volerlo?

L’algoritmo che Archer e Jocker avrebbero poi costruito non è il primo tentativo di applicare il potere dei big data ai libri. Inkitt, la startup berlinese alla base di quello che è stato definito il “primo romanzo selezionato da un algoritmo”, traccia le reazioni dei lettori alle storie postate sulla piattaforma web per identificare un potenziale best seller. Jellybooks, fondata nel 2011 a Londra, misura il grado di “coinvolgimento del lettore” poco prima che il libro sia pubblicato, usando un software scaricato dai lettori sul loro dispositivo in cambio di un accesso anticipato a un titolo.

Il bestsellerometro, però, si contraddistingue nel mettere insieme l’erudizione letteraria di vecchia scuola con la potenza computazionale. The bestseller code, una versione ampliata della tesi discussa da Archer nel 2014, documenta le intricate riflessioni confluite nel processo di “addestramento della macchina a leggere” e scende nel dettaglio delle microdecisioni fino a considerare la dizione e la sintassi usata in un romanzo di successo.

“Questi algoritmi non sono magici”, dice il professore di inglese alla University of Notre Dame Matthew Wilkens, anche lui un umanista digitale. “Riflettono le stesse scelte interpretative e analitiche che adottiamo quando leggiamo attentamente un libro; si cercano determinate ripetizioni, schemi di utilizzo delle parole, accenti tematici e allusioni. È un lavoro che non può essere svolto da qualcuno che non ha familiarità con la letteratura”.

Un’onda quasi perfetta
E allora, cosa può dirci un algoritmo sul tipo di libri che cattura masse di lettori? Alcuni elementi non sorprendono affatto: una “voce” autorevole; una prosa sobria, chiara, spesso colloquiale; verbi dichiarativi che connotano personaggi orientati all’azione e disposti ad assumere il controllo.

Altri sono meno scontati. Catalogando le parole associate ad alcuni argomenti, Archer e Jockers hanno individuato nella coesione narrativa una consuetudine degli autori di best seller. Danielle Steel e John Grisham dedicano un terzo dei loro romanzi ad argomenti ricorrenti: la vita domestica nel caso di Steel, avvocati e legge per Grisham. Questi temi fanno parte di trame più ampie, e danno sempre vita a conflitti e attriti drammatici. Per esempio, Steel coinvolge spesso i suoi personaggi in problemi medici in cui si rischia la vita. Al contrario, i romanzi che vendono di meno tendono a essere cacofonici e confusi, mettono troppa carne al fuoco, sono pieni di argomenti scollegati.

Alcune scoperte poi confondono le previsioni. Il sesso, per esempio, non vende. Secondo il bestsellometro, i libri sul sesso appartengono a una categoria minoritaria, confinata a pochi libri di successo. Questa scoperta è stata fatta all’inizio della ricerca, perciò la comparsa nel 2011 di Cinquanta sfumature di grigio, pieno di scene bollenti ed erotiche, ha rappresentato un colpo di scena. Usando il loro modello, però, Archer e Jockers hanno scoperto che il tema principale del libro era la vicinanza tra le persone (a dire il vero l’argomento prevalente in tutti i best seller esaminati). Cinquanta sfumature di grigio parlava soprattutto dell’intimità emotiva tra i suoi personaggi.

Il modello ha prodotto altri indizi per comprendere il fascino di un libro che è stato oggetto di molte parodie. Tracciando una mappa della sua traiettoria emotiva, Archer e Jockers hanno svelato un ritmo nella narrazione. Rappresentato in un grafico, questo ritmo descrive una forma d’onda quasi perfetta. “Le svolte emotive del libro hanno un ritmo talmente regolare che il lettore sente il tambureggiare delle parole nel corpo, come l’effetto che fa la musica da discoteca”, raccontano Archer e Jocker.

Il cerchio, di Dave Eggers, aveva registrato il cento per cento di possibilità di diventare un best seller

Gli autori spiegano che l’algoritmo ha scoperto alcuni dati interessanti, non una formula per aspiranti scrittori. In realtà, gran parte delle loro scoperte rivela le diverse direzioni in cui può andare la narrativa a partire da basi comuni. L’algoritmo per esempio collocava i best seller in sette tipi di intreccio. E un libro aveva comunque la probabilità di diventare un successo se finiva con una situazione deprimente (tanto più se si tratta di un sequel).

Archer e Jockers respingono l’idea che il loro scopo sia quello di rovinare il mondo dell’editoria. Non hanno alcuna intenzione di commercializzare la loro creazione nel breve periodo, e Jockers la definisce solo un “prototipo” del potenziale di questo approccio alla letteratura. Tuttavia, creando un algoritmo che potrebbe affinare la capacità degli editori di individuare futuri best seller quando sono ancora dei manoscritti, hanno sviluppato un pezzo potenzialmente prezioso di proprietà intellettuale.

Secondo Johnny Geller, dell’agenzia letteraria Curtis Brown di Londra, uno strumento simile potrebbe essere applicato nella fase editoriale della “scoperta”, quando gli agenti esaminano le proposte. Ritiene comunque che sarebbe un contributo al lavoro dell’uomo piuttosto che qualcosa che un giorno potrebbe prenderne il posto.

Carole Baron, editor della casa editrice Knopf e responsabile dell’editing di Danielle Steel, Elmore Leonard, Judy Blume e altri scrittori famosi, si dice scettica circa i poteri predittivi di un algoritmo bastato su opere già pubblicate. “Puoi prevedere il futuro della letteratura e dell’arte se non puoi valutare il fattore dello spirito del tempo? Ci sono sempre delle sorprese”.

Un bel libro
Lo spirito del tempo potrebbe spiegare il destino del libro di Dave Eggers Il cerchio. Il bestellerometro ha consacrato questo romanzo del 2013 come il best seller esemplare degli ultimi trent’anni. Corrispondeva a tutti i parametri della narrativa avvincente e registrava il 100 per cento di possibilità di diventare un best seller. L’algoritmo aveva ragione: secondo i dati riportati da Nielsen BookScan, citati nella rivista Publishers Weekly, a giugno Il cerchio aveva venduto 220mila copie. Si tratta però di cifre rispettabili, non certo spettacolari.

Secondo Baron, il successo di Danielle Steel, la scrittrice più popolare ancora in attività (consideriamo le vendite: si parla di 650 milioni di copie vendute fino a oggi) è in parte dovuto alla sua capacità di sintonizzarsi con lo spirito del tempo. “Le dicevo sempre ‘hai la capacità di incanalare’”, racconta Baron. “Io credo che queste parole e queste idee siano nel mondo e si attacchino ad alcune persone. Danielle diceva, ‘Ho quest’idea’ e si trattava di una completa invenzione. Continuava a lavorarci su, ma l’idea iniziale la colpiva nel cuore della notte”.

Naturalmente la forza dell’inerzia intorno a Steel, Patterson e altri cosiddetti scrittori “in franchising” che sono sempre in cima alle liste dei best seller implica che gli editori sono sempre meno propensi a investire su scrittori sconosciuti. Ed ecco secondo Archer l’ambito in cui il bestsellerometro potrebbe trovare la sua applicazione più nobile: una forza democratizzante, uno strumento per ridurre i timori degli editori che decidono di scommettere su un esordiente – come J. K. Rowling o John Grisham agli inizi – che languisce nella pila di proposte inevase.

“Questo potrebbe essere di grande aiuto soprattutto a una signora Smith dell’Iowa che ha appena scritto un bel libro”, dice.

(Traduzone di Giusy Muzzopappa)

Questo articolo è uscito su The Atlantic.

Internazionale pubblica ogni settimana una pagina di lettere. Ci piacerebbe sapere cosa pensi di questo articolo. Scrivici a: posta@internazionale.it

L’algoritmo che scoprirà il prossimo Harry Potter

Da non perdere

Entra