Modulo 2 · Capitolo 8· Come funziona

RAG, agenti e tool: l'AI che fa cose

Quando l'AI non si limita a rispondere ma consulta documenti, usa strumenti e agisce in autonomia

9 min di letturatecnicoRAGagentitool useMCPpratico

Ultimo aggiornamento: 24 maggio 2026

RAG, agenti e tool: l'AI che fa cose

Fino a qui abbiamo parlato di AI che risponde a domande. Ma l'evoluzione più interessante del 2024-2025 è un'AI che non si limita a parlare — consulta documenti, naviga il web, usa strumenti, esegue azioni. L'AI sta passando da "assistente che parla" a "assistente che fa".

Il problema della conoscenza limitata

I modelli di linguaggio hanno un limite strutturale: sanno solo quello che hanno visto durante l'addestramento. Il loro sapere è "congelato" a una certa data.

Questo significa che:

Non conoscono eventi recenti
Non conoscono i tuoi documenti aziendali
Non conoscono le informazioni nel tuo database
Non possono verificare se quello che dicono è ancora vero

Se chiedi "qual è il fatturato della mia azienda nel Q3 2025", il modello non ha idea. Può solo inventare — e inventerebbe con sicurezza, che è ancora peggio.

Come si risolve? Dando al modello la capacità di consultare fonti esterne. Ed è qui che entra in gioco il RAG.

RAG: dare all'AI i tuoi documenti

RAG sta per Retrieval-Augmented Generation — Generazione Aumentata dal Recupero. Il nome è brutto, il concetto è semplice.

Immagina uno studente che deve rispondere a una domanda d'esame. Può fare in due modi:

Rispondere a memoria — rischia di sbagliare o inventare
Consultare i libri prima di rispondere — molto più affidabile

Il RAG è il secondo approccio applicato all'AI. Invece di rispondere solo dalla sua "memoria" (i dati di addestramento), il modello prima cerca informazioni rilevanti in una base di documenti, poi genera la risposta usando quelle informazioni come riferimento.

Come funziona, passo per passo

Indexing. I tuoi documenti (PDF, pagine web, email, database) vengono spezzati in pezzi e convertiti in rappresentazioni matematiche chiamate embedding — vettori numerici che catturano il significato del testo. Questi vengono salvati in un database vettoriale.
Retrieval. Quando fai una domanda, il sistema converte anche la tua domanda in un embedding e cerca nel database i pezzi di documenti più simili — quelli che probabilmente contengono la risposta.
Generation. I pezzi di documenti trovati vengono inseriti nel prompt del modello, che genera la risposta basandosi su quelle informazioni specifiche.

Il risultato: un'AI che risponde basandosi sui tuoi dati, con informazioni aggiornate, e che può citare le fonti.

Dove lo trovi già

Perplexity: cerca sul web in tempo reale e genera risposte con citazioni. È essenzialmente un RAG sul web.
ChatGPT con file: quando carichi un documento e fai domande, ChatGPT usa un sistema simile al RAG.
Claude con documenti: stessa cosa — carichi PDF, pagine web, codice, e Claude risponde basandosi su quei contenuti.
NotebookLM (Google): carichi documenti e crea un chatbot specializzato su quei contenuti.
Applicazioni aziendali: sempre più aziende creano chatbot interni che rispondono basandosi sulla documentazione aziendale.

Agenti AI: quando l'AI decide da sola

Un agente AI è un sistema che non si limita a generare testo — prende decisioni e compie azioni per raggiungere un obiettivo.

La differenza fondamentale:

Chatbot tradizionale: tu chiedi, lui risponde. Punto.
Agente AI: tu dai un obiettivo, lui decide quali passi fare, li esegue, verifica il risultato, e continua finché non ha finito.

Un esempio concreto: "Organizza un viaggio a Barcellona per il weekend del 15 marzo per 2 persone, budget 800€."

Un chatbot ti darebbe suggerimenti. Un agente potrebbe (con i permessi giusti): cercare voli, confrontare prezzi, cercare hotel, verificare disponibilità, controllare il meteo, suggerire attività, e preparare un itinerario completo — facendo decine di ricerche e decisioni intermedie senza chiederti niente.

Il loop di un agente

Un agente lavora in un ciclo:

Osserva — analizza la situazione attuale e l'obiettivo
Pensa — decide quale azione compiere
Agisce — esegue l'azione (cerca sul web, scrive codice, chiama un'API)
Valuta — controlla il risultato
Ripete — se non ha raggiunto l'obiettivo, torna al punto 1

Questo loop è ciò che rende gli agenti potenti e, allo stesso tempo, rischiosi. Un agente che prende decisioni sbagliate può concatenare errori e produrre disastri — ecco perché i sistemi attuali hanno ancora molto supervisione umana.

Agenti che esistono oggi

Claude Code (Anthropic). Un agente per programmatori: gli dai un obiettivo ("aggiungi la funzionalità X al progetto") e lui naviga il codice, scrive modifiche, testa, corregge errori, il tutto in autonomia dal terminale.

Cursor Agent e Codex CLI. Cursor è un IDE costruito intorno all'AI capace di fare refactoring autonomo su interi codebase. Codex CLI (OpenAI) è la versione da terminale. Devin (Cognition) è il primo "AI software engineer" commerciale, in grado di prendere in carico ticket e consegnare PR complete.

Operator (OpenAI) e Claude for Chrome (Anthropic). Agenti che navigano il web: compilano form, fanno acquisti, prenotano appuntamenti — usando un browser come farebbe un umano. Il progetto Comet di Perplexity è un browser completamente ridisegnato attorno agli agenti AI.

Managed Agents (Google, I/O 2026). Con una singola chiamata all'API Gemini, viene istanziato un ambiente Linux remoto dove l'agente può ragionare, eseguire codice, usare tool e navigare il web — senza configurazione manuale dell'infrastruttura.

Computer Use (Anthropic). Claude che controlla direttamente il computer: muove il mouse, clicca, digita. Può usare qualsiasi software come farebbe una persona.

Il 2026 è diventato l'anno in cui gli agenti sono passati da demo a prodotti reali. I sistemi attuali funzionano bene per compiti specifici e ben definiti, ma fanno ancora fatica con obiettivi vaghi, situazioni impreviste e task che richiedono giudizio complesso.

Function calling / Tool use: l'AI che usa strumenti

Il tool use (o function calling) è il meccanismo che permette a un'AI di usare strumenti esterni — e il punto è che è il modello a decidere quale strumento usare e quando.

Funziona così:

Lo sviluppatore definisce una lista di "tool" disponibili (funzioni che il modello può chiamare), ognuno con una descrizione di cosa fa
L'utente fa una domanda
Il modello analizza la domanda e decide se serve un tool e quale
Il modello "chiama" il tool con i parametri appropriati
Il tool restituisce il risultato
Il modello usa il risultato per formulare la risposta

Esempio pratico: un chatbot per il meteo.

Tool disponibili: get_weather(city, date), get_forecast(city, days)
L'utente chiede: "Pioverà a Roma domani?"
Il modello decide di usare get_forecast("Roma", 1)
Il tool restituisce i dati meteo
Il modello risponde: "Domani a Roma è prevista pioggia nel pomeriggio, con temperature intorno ai 18°C"

Il modello non "conosce" il meteo — ma sa usare lo strumento giusto per trovare l'informazione.

Questo meccanismo è alla base di quasi tutte le applicazioni AI moderne: chatbot che interrogano database, assistenti che mandano email, tool che analizzano fogli Excel.

MCP: lo standard per connettere tutto

MCP (Model Context Protocol) è uno standard aperto creato da Anthropic per connettere i modelli AI a servizi e strumenti esterni in modo unificato.

Il problema che risolve: ogni servizio (Google Drive, Slack, GitHub, il tuo database) ha la sua API con il suo formato. Senza uno standard, integrare un'AI con 10 servizi diversi richiede 10 integrazioni custom — un incubo.

MCP crea un protocollo comune: un modo standard per dire all'AI "ecco i tool disponibili, ecco come usarli, ecco i dati che puoi consultare". Qualsiasi servizio che implementa MCP diventa automaticamente utilizzabile dall'AI.

L'analogia: USB. Prima di USB, ogni dispositivo aveva il suo connettore proprietario. USB ha creato uno standard universale. MCP vuole fare lo stesso per le connessioni AI-servizi.

In pratica, con MCP puoi:

Connettere Claude ai tuoi Google Drive, Slack, GitHub
Far sì che l'AI legga email, documenti, codice
Permettere all'AI di compiere azioni: creare task, mandare messaggi, aggiornare database
Il tutto con un protocollo unificato e sicuro

A marzo 2026, MCP ha superato 97 milioni di installazioni e tutti i principali provider AI (OpenAI, Google, xAI) hanno rilasciato tooling MCP-compatibile. Non è più "relativamente nuovo" — è lo standard de facto per connettere modelli e servizi.

Mettere tutto insieme

Le tecnologie di questo capitolo si combinano:

RAG dà all'AI accesso ai tuoi dati
Tool use permette all'AI di compiere azioni
MCP standardizza le connessioni
Agenti orchestrano tutto per raggiungere obiettivi complessi

Un agente moderno potrebbe: ricevere la tua richiesta, consultare i tuoi documenti (RAG), usare strumenti per raccogliere informazioni esterne (tool use), prendere decisioni basate su tutto il contesto, e eseguire azioni concrete — il tutto connesso via MCP.

È un cambio di paradigma: dall'AI come "enciclopedia intelligente" all'AI come "assistente che lavora per te".

I limiti attuali

Entusiasmo a parte, è importante essere onesti sui limiti:

Affidabilità. Gli agenti commettono errori. Un agente che sbaglia un passaggio può concatenare errori nei passaggi successivi. La supervisione umana è ancora necessaria per task importanti.

Sicurezza. Un agente con accesso a email, file e strumenti è potente — ma anche rischioso. Cosa succede se un prompt malevolo lo convince a fare qualcosa di sbagliato? La sicurezza degli agenti è un campo di ricerca attivo.

Costo. Un agente che fa 20 chiamate al modello per completare un task costa 20 volte una singola risposta. Per task complessi, i costi possono salire rapidamente.

Latenza. Un agente che deve fare ricerche, consultare tool e ragionare a ogni passaggio è inevitabilmente più lento di una risposta diretta.

Come si misurano. Benchmark come SWE-bench (risoluzione di bug reali su codice open source) e GAIA (compiti pratici multi-step) stanno diventando i metri standard per valutare gli agenti. I punteggi più alti a inizio 2026 si aggirano sull'80% su SWE-bench per i migliori sistemi — prestazioni impensabili solo un anno fa.

In pratica 🎯

Prova il RAG in azione senza scrivere una riga di codice:

Opzione 1 — ChatGPT:

Prendi un documento che hai (un PDF di lavoro, un report, un articolo lungo)
Caricalo nella chat di ChatGPT (icona della graffetta)
Chiedi: "Riassumimi i punti chiave di questo documento"
Poi chiedi qualcosa di specifico: "Nella sezione sui costi, qual è il budget previsto?"
Nota come risponde basandosi sul documento, non sulla sua conoscenza generale

Opzione 2 — NotebookLM:

Vai su NotebookLM (gratuito con account Google)
Carica 2-3 documenti su un argomento
Fai domande che richiedono di incrociare informazioni tra i documenti
Nota come cita le fonti specifiche nelle risposte

Hai appena usato il RAG. Ora immagina la stessa cosa applicata a tutta la documentazione della tua azienda, al tuo archivio email, al tuo codice sorgente. Capisci perché è un game changer?

Risorse correlate

📖 Glossario: RAG, Embedding, Vector Database, Agente AI, Function Calling, Tool Use, MCP, API
📄 Doc: ChatGPT (file upload, GPTs), Claude (documenti, MCP), Perplexity (RAG web)
🔧 Tool: NotebookLM, Perplexity, ChatGPT, Claude

Non hai capito qualcosa?

Chiedi a un chatbot AI. Abbiamo preparato il prompt per te con il contesto di questa lezione.

Si aprirà in una nuova scheda con il prompt pronto

PrecedenteAI e dati: il carburante

ProssimoAI al lavoro: casi d'uso per ruolo