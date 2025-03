La nuova tendenza nel mondo delle intelligenze artificiali sono gli agenti autonomi. Visto che è molto complicato stare al passo con tutte le novità – vere o presunte o gonfiate dal marketing –, proviamo a fare un riepilogo per capire esattamente cosa sono, come funzionano e cosa possono già fare questi agenti autonomi. Fino a pochi anni fa, quando si parlava di assistenti basati sull’intelligenza artificiale si pensava a strumenti come Siri, integrato nell’iPhone, Alexa della Amazon. Non sono esattamente come i robot dei film e così li abbiamo trovati spesso oggetto di gag o veri e propri monologhi da stand up comedy.

Oppure pensavamo ai chatbot aziendali, capaci, almeno in teoria, di rispondere a domande predefinite e di eseguire istruzioni semplici. Chiunque ne abbia sperimentati avrà provato anche un senso di frustrazione: l’esperienza d’uso di questi chatbot era – ed è – spesso molto deludente, soprattutto se hai bisogno di un’assistenza urgente e se chi ha programmato questi strumenti non li ha resi efficaci nel passarti rapidamente un essere umano quando serve. Poi è arrivato ChatGpt e, a seguire, gli altri modelli linguistici e già nel 2023 sono emersi i primi tentativi di agenti autonomi un po’ più evoluti: programmi che, almeno in teoria, invece di limitarsi a fornire risposte, sono in grado di pianificare azioni, suddividerle in attività diverse e portarle a termine senza bisogno di una supervisione costante. Il progetto AutoGpt ha dimostrato che un large language model (llm) può essere usato per orchestrare operazioni complesse, connettendosi a strumenti esterni e decidendo i passaggi necessari per raggiungere un obiettivo. Eppure, i primi esperimenti avevano problemi evidenti: gli agenti si inceppavano, prendevano decisioni errate o si bloccavano in loop infiniti.

Negli ultimi due anni, però, la ricerca e le aziende hanno accelerato, con risultati tangibili. Alla fine del 2024, la OpenAi ha presentato Operator, un’estensione di ChatGpt che può navigare su internet, riempire moduli, prenotare servizi online e interagire con le pagine web. Contemporaneamente, in Cina, la startup Butterfly Effect ha lanciato Manus, un agente multimodale che coordina più sottosistemi specializzati per eseguire compiti complessi. Manus non è ancora disponibile al pubblico: si può provare a chiedere un compito e poi ci si mette in coda aspettando di sapere se effettivamente il compito verrà svolto o meno. In pratica, questi nuovi sistemi possono svolgere quattro tipi di attività principali. La prima funzione, già incorporata in vari modelli (ChatGpt, Gemini, Grok e altri) è la ricerca avanzata e assistita con ia che ho spiegato qui. Gli agenti possono cercare dati su internet, incrociare fonti, analizzare documenti e riassumere il contenuto per l’utente. Alcuni modelli avanzati, già messi alla prova con il benchmark Gaia, possono rispondere a domande complesse e creare rapporti molto dettagliati. La seconda funzione è l’organizzazione. Un agente può fare un piano di viaggio, pianificare una strategia di mercato o valutare investimenti finanziari, adattandosi in base a nuove informazioni. C’è un video dimostrativo in cui Manus, per esempio, seleziona autonomamente i migliori candidati per un lavoro, scremando una quindicina di curriculum e creando un foglio di calcolo con le valutazioni e le motivazioni. Poi, alcuni agenti sono in grado di interagire con software esistenti: possono compilare moduli, estrarre dati da documenti, inviare email, gestire pratiche amministrative. OpenAi Operator, per esempio, è progettato proprio per svolgere azioni sui siti web senza bisogno di API dedicate. Infine, c’è la parte di composizione di contenuti e di creatività. Gli agenti possono generare immagini, presentazioni, codice software, pagine web, applicativi. Ce ne sono già molti in commercio.

Tuttavia, l’esperienza personale – e anche quella condivisa con altri che usano questi strumenti per test e per lavoro – suggerisce che la promessa della piena automazione è, almeno per il momento, decisamente lontana. Operator chiede conferma all’utente prima di eseguire operazioni critiche, mentre Manus ha bisogno di continui aggiustamenti per evitare errori. Inoltre, alcuni esperimenti fatti con il benchmark AgentHarm, usato per valutare la sicurezza di questi strumenti, hanno mostrato che molti agenti autonomi sono facilmente manipolabili – vedere quel che dicevamo a proposito della RedArena aiuta a capire in che senso – e possono eseguire compiti dannosi nelle mani di malintenzionati. La corsa agli agenti autonomi coinvolge le grandi aziende tecnologiche e le startup emergenti: la Anthropic è stata fra le prime a rendere disponibili agenti personalizzabili con Claude; la Microsoft ha integrato agenti nei suoi prodotti aziendali, permettendo ai clienti di costruirne di personalizzati tramite Copilot Studio. Google ha introdotto funzionalità simili nei suoi sistemi, ha lanciato Mariner e sta sviluppando automazioni per Android e i suoi servizi cloud. La Ibm sta puntando sull’uso aziendale con Watsonx Orchestrate, un sistema per automatizzare flussi di lavoro complessi. La direzione è abbastanza chiara, guidata da logiche di mercato e di profitto: nei prossimi anni le aziende tecnologiche tenteranno di integrare sempre di più gli agenti nei servizi digitali. Come useremo queste integrazioni? Se cadremo nella trappola della produttività aumentata entreremo nella solita spirale capitalista: il profitto di pochi aumenterà, gli altri dovranno lavorare sempre di più, con il pretesto che le macchine avranno alleggerito i loro compiti. Se cederemo all’idea dell’automazione assoluta ci renderemo dipendenti e vulnerabili. Lo sviluppo di questi strumenti dovrebbe essere guidato da un sano dibattito pubblico e da una grande consapevolezza: tutto il contrario di quel che sta succedendo. Comunque, se le cose dovessero andare male, ci sarà sempre qualche umano in grado di staccare la spina.

Questo testo è tratto dalla newsletter Artificiale.

