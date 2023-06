Negli Stati Uniti, durante un autunno insolitamente soleggiato del 1970 centinaia di studenti e docenti dell’università di Syracuse, nello stato di New York, si accomodarono uno per volta davanti a una stampante elettronica (simile a una macchina da scrivere elettrica) connessa a un elaboratore centrale Ibm 360 che era dall’altra parte del campus. Quasi nessuno aveva mai usato un computer prima di allora, meno che mai un sistema di recupero delle informazioni basato su un computer. Quando toccavano la tastiera gli tremavano le mani. In seguito molti avrebbero raccontato che avevano il terrore di danneggiare il sistema.

I partecipanti stavano conducendo le loro prime ricerche online, inserendo parole scelte con cura per trovare i sommari di testi di psicologia in una banca dati. Digitavano un termine chiave o un’istruzione per ogni riga, per esempio “motivazione” nella riga 1, “stima” nella 2 e “L1 L2” nella 3 per cercare saggi che includessero entrambi i termini. A quel punto il terminale produceva una stampata in cui indicava quanti documenti corrispondevano alla ricerca. Gli utenti potevano restringerla o ampliarla per poi generare un elenco di citazioni di articoli. Nel vedere la risposta che arrivava da un computer così lontano, molti scoppiavano a ridere.

In seguito, in un sondaggio telefonico fu chiesto ai partecipanti di descrivere con due o tre parole l’esperienza. Su un totale di 78 parole, 21 erano lo stesso aggettivo: “frustrante”. I partecipanti avevano riscontrato difficoltà a registrarsi nel sistema e, tra le altre cose, raccontavano errori imprevedibili, “risultati irrilevanti” e, soprattutto, di non sapere bene “quali parole usare in una ricerca”. Al tempo stesso ritenevano il sistema affascinante (“divertente”, “accurato”, “mi piacciono i computer”) e il 94 per cento dichiarava di voler continuare a usare il nuovo sistema, il Supars (Syracuse university psychological abstracts retrieval service), se fosse stato disponibile. In molti si offrirono di mantenere vivo l’esperimento, chiedendo ai loro dipartimenti di finanziare il progetto.

Questo gruppo di cavie accademiche, in larga misura laureati in pedagogia, psicologia e biblioteconomia, facevano parte di un grande esperimento sulla ricerca online gestito dalla facoltà di biblioteconomia dell’università di Syracuse. Il Supars è stato uno dei tanti studi ambiziosi sugli archivi digitali condotti tra la fine degli anni sessanta e la metà degli anni settanta nei campus degli Stati Uniti. I fattori che avevano portato a un aumento di questi studi erano tanti. I progressi nel campo dell’elaborazione informatica, dal punto di vista della velocità e della capacità d’immagazzinamento dei dati, avevano permesso la digitalizzazione e il trasferimento online degli archivi e dei cataloghi accademici. I terminali potevano essere collocati in giro per i campus, così da consentire l’accesso da lontano al computer centrale. E i finanziamenti militari e industriali per la ricerca basata sull’informatica erano più abbondanti che mai. I bibliotecari delle università colsero al volo l’opportunità di esplorare questa nuova, costosissima tecnologia. E gli atenei offrivano la possibilità di collaborare con aziende tecnologiche e gruppi militari: il Supars era sponsorizzato dall’aeronautica degli Stati Uniti.

È facile capire perché i bibliotecari degli anni settanta volessero rivoluzionare la consultazione. Il lavoro nelle università stava crescendo al punto che presto non ci sarebbero stati abbastanza bibliotecari per svolgerlo. Ma se i ricercatori volevano le informazioni di cui avevano bisogno dovevano seguire una procedura che richiedeva tempo e fatica fisica, e l’intervento di un bibliotecario. Potevano sfogliare le riviste specializzate del loro campo, ma per trovare tutto quello che era stato pubblicato fino a quel momento avevano comunque bisogno dell’aiuto di qualcuno per individuare i soggetti giusti nell’enorme archivio della Biblioteca del congresso. Definiti i termini, dovevano a quel punto spulciare i libri pubblicati nel catalogo della biblioteca e gli articoli di riviste negli indici, come lo Science citation index e le bibliografie compilate a mano dai bibliotecari specializzati dell’università. Infine dovevano materialmente andare a prendere dagli scaffali della biblioteca i libri e le raccolte di periodici in cui si trovava quello che cercavano, sempre che fosse disponibile.

Non c’è da stupirsi se chi ha preso parte al Supars lo trovasse affascinante nonostante i suoi limiti. E, tenuto conto della familiarità che i bibliotecari delle università avevano con le difficoltà della consultazione, è del tutto sensato che avessero progettato un sistema per aggirare titoli e indici. La cosa più sorprendente è che di tutti gli esperimenti di consultazione online condotti in quel periodo – compresi sistemi di ricerca come Dialog della Lock­heed, in seguito diventato un prodotto per aziende – il Supars era quello che più di tutti gli altri si avvicinava alla ricerca in rete di oggi, anticipando diverse caratteristiche fondamentali dei protocolli di ricerca su cui continuiamo a basarci dopo più di cinquant’anni.

Il Supars e altri sistemi ormai dimenticati sono stati i precursori dei motori di ricerca di oggi. La storia popolare di internet dà molta importanza ai programmatori della Silicon valley – o, in alcuni casi, all’ex vicepresidente statunitense Al Gore – ma molti dei concetti originali della ricerca sono nati da esperti di biblioteconomia che hanno lavorato sull’accessibilità di documenti nel tempo e nello spazio. I loro progressi, ottenuti grazie a finanziamenti provenienti dal settore militare e dall’industria, oggi sono visibili ovunque nel panorama informatico. Sono sistemi sviluppati da pionieri nei campus universitari e usati ancora oggi dalle aziende multimiliardarie nel settore delle ricerche in rete e dei cataloghi bibliografici, da Google a WorldCat.

Il Supars è stato progettato da una bibliotecaria di nome Pauline Atherton (oggi Pauline Atherton Cochrane). Nel 1960, a trent’anni e all’inizio della sua carriera da bibliotecaria, era stata la curatrice dei riferimenti per l’edizione di quell’anno della World book encyclopedia, garantendo collegamenti incrociati scrupolosi e accurati tra diversi articoli. Già nel 1966 lavorava per le biblioteche dell’università di Syracuse e nella facoltà di biblioteconomia, dove nel 1968 aveva condotto una dimostrazione del primo uso di un documento di classificazione numerico online per facilitare la consultazione (Audacious). Quello stesso anno aveva fondato il primo laboratorio di didattica basata sull’informatica, che integrava la ricerca online alle normali lezioni in classe per la scuola di biblioteconomia (nel contesto del mondo prima di internet, con l’espressione online s’intendeva un collegamento in rete e in tempo reale tra un computer che faceva da sistema centrale e alcuni dispositivi periferici).

L’anno seguente, nel 1969, Atherton progettò il Supars insieme al collega Jeffrey Katzer, un altro docente di biblioteconomia all’università di Syracuse. L’obiettivo principale del progetto era rendere disponibile su vasta scala la consultazione online per capire più cose possibili sul modo in cui gli utenti facevano ricerche, su quello che pensavano di questo strumento e su ciò di cui avevano bisogno per migliorare le consultazioni. La squadra mise quindi a disposizione di tutto l’ateneo un corpus consultabile di contenuti accademici, più di 35mila voci recenti prese da Psychological abstracts , l’indice per titolo e argomento dell’associazione degli psicologi degli Stati Uniti. Usato per l’indicizzazione e il recupero dati nel sistema del Supars, era la prima banca dati di dimensioni significative disponibile online aperta al pubblico. Naturalmente siamo lontanissimi dalle dimen­sioni e dall’estensione della ricerca in rete di oggi, ma per l’epoca il gruppo di utenti e i contenuti erano enormi.

Due decisioni di Atherton e della sua squadra resero il Supars davvero innovativo. In primo luogo, eliminarono la catalogazione per soggetto e fecero in modo che tutte le parole – tranne congiunzioni, articoli e simili – fossero consultabili in modo diretto. In questo modo il Supars è diventato il primo sistema in cui un testo era disponibile online per la consultazione e per l’elaborazione. In secondo luogo, salvarono ogni consultazione del Supars in una banca dati parallela che poteva essere interrogata. Il Supars è stato quindi il primo esperimento in cui gli utenti potevano avere accesso alle ricerche già fatte da altri e usarle per trovare termini o approcci alternativi.

Ciascuna di queste funzioni sarebbe stata innovativa di per sé, ma per capire quanto la loro combinazione fosse all’avanguardia, vale la pena di osservare come funzionano oggi i servizi di ricerca in rete. Google, Bing e gli altri motori di ricerca indicizzano le pagine web usando due componenti principali: i crawler cercano nuove pagine e scansionano regolarmente le pagine già trovate; i parser analizzano il contenuto delle pagine, immagazzinando le informazioni ricavate, compreso tutto il testo, in una banca dati interna. Quando un utente fa una richiesta, Google tenta di collegare le parole e le frasi contenute nell’interrogazione alle pagine nella sua banca dati e fornisce all’utente i risultati più rilevanti.

Oltre alle parole inserite direttamente dagli utenti, gli attuali algoritmi di ricerca in rete tengono conto anche di altri termini strettamente connessi a quelli inseriti nell’interrogazione, compresi i sinonimi (per esempio una ricerca con il termine “bici” restituisce anche i risultati per “bicicletta” e “ciclo”) e altre parole collegate in modo diretto.

Guido Scarabottolo

La maggior parte dei motori di ricerca comprendono anche parole incluse in interrogazioni simili fatte da altri, che diventano parte integrante dei dizionari interni usati per aggiungere termini di ricerca all’interrogazione di un utente. Questo processo d’inclusione di parole correlate, noto come espansione dell’interrogazione, genera risultati significativamente migliori. Allo stesso modo, anche Google e altri motori di ricerca suggeriscono ulteriori possibili richieste con l’autocompilazione, creando previsioni basate sulle ricerche precedenti per aiutare gli utenti a completare velocemente le loro domande.

Il Supars ha dunque anticipato la ricerca in rete mettendo gli utenti nelle condizioni di consultare direttamente il testo nei documenti e consentendo a chi faceva una ricerca di agganciarsi alle strategie di consultazione già usate da altri. Il Supars determinava anche l’utilità di ciascuna di queste consultazioni con l’analisi del suo registro delle transazioni. Dopo un primo progetto pilota, furono condotte due sessioni di test del Supars, una tra ottobre e dicembre del 1970 (Supars I) e un’altra tra novembre e dicembre del 1971 (Supars II). La squadra di Atherton arrivò alla conclusione che i testi integralmente ricercabili erano un modo efficiente per migliorare la rilevanza (nota come recall nel gergo degli scienziati) dei risultati, quasi paragonabili a quelli ottenuti con l’aiuto di un bibliotecario umano. Il vocabolario in costante evoluzione di un sistema che continuava ad adattarsi ai comportamenti umani era inoltre un passo in avanti rispetto ai sistemi di ricerca in uso fino a quel momento, basati su un vocabolario fisso e deciso una volta per tutte. La squadra del Supars non poteva sapere che pochi anni dopo gli algoritmi della ricerca online alimentati dall’intelligenza artificiale avrebbero fatto esattamente questo lavoro, ma capivano che questo sarebbe stato un ottimo modo per aggiornare di continuo i risultati della consul­tazione.

In una lettera del 1972 al direttore della rivista Journal of the American Society for Information Science, Katzer descriveva il ragionamento alla base della necessità di fornire una banca dati di tutte le precedenti interrogazioni: “Obiettivo di questa banca dati delle consultazioni (search data base) è aiutare l’utente nel formulare delle interrogazioni alla banca dati dei documenti. Poiché il Supars attualmente usa un vocabolario illimitato, il risultato restituito dalla banca dati delle consultazioni potrebbe aiutare l’utente a scoprire altri modi per approfondire il suo argomento nella banca dati dei documenti: fornirà parole chiave usate da altri esperti di quell’argomento oltre a una rappresentazione dei loro ragionamenti. A nostro parere stiamo muovendo i primi passi in un campo fin qui inesplorato: l’uso dell’intelligenza dell’utente per potenziare il lavoro confluito nell’intelligenza automatica”.

La tentazione di dipingere la squadra di Atherton come un gruppo di futuristi utopici è forte, ma non è così. Il Supars era stato creato specificatamente per un futuro in cui ci sarebbero stati meno bibliotecari in carne e ossa ad aiutare i ricercatori. Espandere l’intelligenza collettiva era stata una soluzione pratica, non idealistica. Il gruppo di Atherton ha osservato che, poiché i posti in cui erano messi i terminali informatici alla Syracuse university erano “distanti da un bibliotecario addetto alle consultazioni o da qualsiasi altro specialista umano nell’area di interesse dell’utente”, sarebbe stato necessario un aiuto ulteriore che poteva venire “dall’intelligenza umana di tutti gli utenti del sistema”. Le decisioni aggregate di altri ricercatori, scrivevano, erano solo un sostituto di un bibliotecario esperto: “Idealmente un utente dovrebbe poter parlare con qualcuno che ha competenze nella sua area d’interesse e avere a disposizione una grande varietà d’informazioni. A quel punto l’utente potrebbe sviluppare o formulare un’interrogazione al sistema con la specificità e la capillarità necessarie a ottenere il massimo dall’archivio digitale”.

La squadra del Supars intravedeva non solo il futuro prossimo, ma anche quello che in un mondo basato sull’informatica distribuita e in rete sarebbe andato perduto: sarebbero stati sempre più numerosi i ricercatori che avrebbero lavorato fuori dalla biblioteca, lo avrebbero fatto da soli e avrebbero avuto bisogno di un supporto che i bibliotecari non sarebbero più stati in grado di fornire. La squadra di Atherton non stava prevedendo un mondo in cui i bibliotecari esperti non sarebbero più serviti: si stava preparando a un mondo in cui la ricerca sarebbe stata condotta in molti luoghi diversi, troppo lontani da un banco per le consultazioni perché i bibliotecari potessero essere d’aiuto.

Gli sperimentatori del Supars arrivarono anche alla conclusione che l’uso dei termini di consultazione usati da altri era utile ma aveva dei limiti concreti. Una delle raccomandazioni finali suggeriva di continuare a sviluppare un vocabolario controllato, poiché “c’è ancora bisogno nella consultazione interattiva di una qualche forma di vocabolario utente o controllo dei sinonimi”. Lo capirono dopo aver visto quanto spesso i partecipanti al Supars incappassero in problemi di consultazione del vocabolario: in un caso la ricerca della parola people (persone) anziché humans (esseri umani) non aveva restituito nessun risultato. I partecipanti all’esperimento avvertivano la mancanza della catalogazione per soggetto. In un sondaggio interno al Supars gli era stato chiesto se preferivano un sistema a testo libero o uno in cui il vocabolario era più controllato: il 42 per cento preferiva il testo libero, il 36 per cento il vocabolario controllato e il 12 per cento li voleva entrambi.

Sotto questo aspetto il Supars è significativo sia in quanto progetto all’avanguardia per l’epoca sia come contronarrazione rispetto alle consolidate storie tecnoutopistiche di internet e del web. In queste storie i cosiddetti visionari hanno quasi sempre immaginato un mondo in cui la tecnologia avrebbe migliorato in senso assoluto la comunicazione, l’intelligenza umana e la loro efficacia. Per esempio, uno dei personaggi più celebrati di questa storia è Joseph Carl Robnett “Lick” Licklider, la cui idea di una rete universale ha ispirato in modo diretto l’invenzione di Arpanet, spesso definita “la prima internet”. Nel 1968, un anno prima della progettazione del Supars, nel suo saggio intitolato The computer as a communication device (Il computer come strumento di comunicazione) Licklider scriveva che “nel giro di pochi anni gli uomini potranno comunicare in modo più efficace attraverso una macchina che per mezzo dell’interazione faccia a faccia” e tratteggiava una società appagante mediata dalle interazioni tra computer ed esseri umani. Licklider prevedeva “una vita più felice per l’individuo online” e “una comunicazione più efficace e produttiva, dunque più piacevole”. Come spesso accade in questo genere di testi futuristici sul potenziale della tecnologia informatica, era al tempo stesso profetico e troppo ottimistico.

Oggi la cultura celebra persone come Licklider per essere state visionarie in senso positivo. Si dovrebbero celebrare anche Atherton e la squadra di ricerca del Supars, perché hanno avuto il merito di vedere ciò che sarebbe andato perduto nel futuro e di progettare un rimedio. In questo modo avremo un’immagine più complessa di come diversi tipi di ricercatori hanno immaginato il mondo del futuro.

Nel 2022 e 2023, mentre tra entusiasmo e scetticismo vengono presentati i primi motori di ricerca basati sull’intelligenza artificiale generativa, è utile analizzare cosa andrà perduto quando i ricercatori si affideranno a questi strumenti. Quando potremo limitarci a inserire dei quesiti di ricerca per ottenere, per esempio, sintesi letterarie istantanee, non assisteremo solo a un enorme balzo in avanti. Questa nuova tecnologia farà perdere conoscenza di base e contesti. Sarà una perdita diversa rispetto a quella immaginata da Atherton, ma anche questa sarà profondamente significativa. La squadra del Supars può insegnarci come prevedere queste conseguenze in anticipo senza lamentarci come dei luddisti, ma valutando in che modo aiutare i ricercatori a superarle. ◆ gim

Monica Westin è una biblioteconomi­sta statunitense. Lavora a Google sulla gestione del diritto d’autore e insegna alla City university di Londra, nel Regno Unito. Questo articolo è uscito sul giornale scientifico online Aeon con il titolo Ingenious librarians.

Internazionale pubblica ogni settimana una pagina di lettere. Ci piacerebbe sapere cosa ne pensi di questo articolo.