Logo di Internazionale
Home Sommario Primo piano Cartoline Interblog Agenda Firme Shop Abbonati Internazionale a Ferrara
Luca Sofri
È un giornalista italiano. Scrive su vari giornali, tra cui Vanity Fair e Wired, e ha un programma su Radio2. Il suo ultimo libro è Playlist. La musica è cambiata (Rizzoli 2008). Il suo blog è wittgenstein.it

Archivio
Tutti gli articoli di Luca Sofri pubblicati da Internazionale


Bibliografia essenziale
Playlist
Rizzoli 2008

Firme | Luca Sofri
| Solo testo |
Copiare libri e parole

Ogni giorno, in tutto il mondo, scriviamo su internet sessanta milioni di captcha: l'equivalente di due enciclopedie

Internazionale 726, 10 gennaio 2008

Chi frequenta intensamente internet, e per esempio si trova a voler scrivere un commento su un blog, è ormai probabilmente abituato a imbattersi in un captcha, anche se forse non sa che si chiama così.

Un captcha – il tipo più frequente – è quella piccola parolina spesso di nessun senso, distorta, sfocata o parzialmente coperta e resa poco leggibile, che bisogna trascrivere esattamente per poter accedere alla pagina successiva o inoltrare il proprio commento. È un modo per dimostrare al computer che siete un essere umano e non un altro computer.

Il primo a porre il problema della necessità di distinguere la risposta di un umano da quella di un computer fu un celebre matematico inglese dalla vita breve e tormentata, Alan Turing.

Turing morì a 42 anni dopo aver morso una mela avvelenata. Fu ufficialmente un suicidio, ma molti misteri avvolgono i suoi ultimi anni, in cui venne condannato a un'orribile terapia di riabilitazione dalle sue pretese deviazioni sessuali. Ma Turing è considerato soprattutto il padre dei computer moderni per i suoi studi e per le sue elaborazioni.

I captcha con le paroline sono definiti dei test di Turing inversi: al contrario della questione che si era posto lui, con il captcha è una macchina a giudicare se ha di fronte un umano o un'altra macchina.

Nel caso di internet, la necessità del riconoscimento si è posta presto, contemporaneamente alla nascita dei primi software creati per superare gli ostacoli posti da altri software. I casi più importanti sono quelli dei programmi progettati per ingannare i motori di ricerca e i loro algoritmi, per influenzare i risultati di sondaggi o votazioni online, o per diffondere spam sui siti, nei forum o nei commenti dei blog.

In quest'ultimo caso, per esempio, ci sono programmi in grado di individuare i campi di commento dei blog, di inserirci i messaggi di spam e inoltrarli come commento, automaticamente e in centinaia di blog diversi. Le maggiori piattaforme di blog, per evitarlo, chiedono a chi inoltra il commento di trascrivere una parolina abbastanza distorta da essere irriconoscibile da un software: il captcha.

Se ci pensate, benché gli scienziati studino la questione da decenni, per noi persone normali è un caso piuttosto raro: l'obiettivo dei programmatori non è sottrarre un impegno a un umano per darlo a una macchina, ma viceversa. Un caso piuttosto raro in cui possiamo dimostrare di saper fare una cosa – per noi peraltro familiare e facilissima – che un computer non sa fare: riconoscere una calligrafia (calligrafia vuol dire bella scrittura, e qualcuno da qualche parte nel mondo sta probabilmente già lavorando all'impatto estetico e artistico dei captcha).

Ora che stiamo diventando familiari con le paroline, qualcuno ha riflettuto su come prendere due piccioni con la fava del nostro lavoro di decifratori. Alla Carnegie Mellon university, dove avevano coniato il termine captcha (un acronimo che sta per "test di Turing pubblico e completamente automatico per distinguere computer e umani"), hanno calcolato che in tutto il mondo vengono impiegate ogni giorno centocinquantamila ore di lavoro per trascrivere dei captcha.

E che così facendo scriviamo l'equivalente di un paio di enciclopedie al giorno, ma composte da parole o frasi prive di senso. E allora si sono inventati recaptcha, un progetto per trarre profitto da tutto questo lavoro applicandolo a una necessità simmetrica a quella affrontata dalle captcha: l'archiviazione digitale di tutti i libri e documenti che la nostra cultura ha prodotto prima dell'era digitale, a mano o in stampa.

Chiunque abbia mai usato uno scanner per leggere un testo conosce le difficoltà dei programmi di lettura nel decifrare esattamente i testi in cui i caratteri non sono netti e puliti.

Recaptcha fornisce ai siti che usano i captcha singoli brani di testo che uno scanner ha estratto da un documento da digitalizzare e che il computer non è in grado di trascrivere esattamente: e quando voi capitate su quei siti e decifrate un captcha (ne troverete due, uno fa da controprova), la vostra risposta contribuirà all'archiviazione per i posteri della conoscenza universale. Umani o macchine che siano, i posteri.
| Solo testo |
InternazionaleChi siamoposta@internazionale.it