Modulo 2 · Capitolo 8· Come funziona

RAG, agenti e tool: l'AI che fa cose

Quando l'AI non si limita a rispondere ma consulta documenti, usa strumenti e agisce in autonomia

9 min di letturatecnicoRAGagentitool useMCPpratico

Ultimo aggiornamento: 1 marzo 2026

RAG, agenti e tool: l'AI che fa cose

Fino a qui abbiamo parlato di AI che risponde a domande. Ma l'evoluzione più interessante del 2024-2025 è un'AI che non si limita a parlare — consulta documenti, naviga il web, usa strumenti, esegue azioni. L'AI sta passando da "assistente che parla" a "assistente che fa".

Il problema della conoscenza limitata

I modelli di linguaggio hanno un limite strutturale: sanno solo quello che hanno visto durante l'addestramento. Il loro sapere è "congelato" a una certa data.

Questo significa che:

  • Non conoscono eventi recenti
  • Non conoscono i tuoi documenti aziendali
  • Non conoscono le informazioni nel tuo database
  • Non possono verificare se quello che dicono è ancora vero

Se chiedi "qual è il fatturato della mia azienda nel Q3 2025", il modello non ha idea. Può solo inventare — e inventerebbe con sicurezza, che è ancora peggio.

Come si risolve? Dando al modello la capacità di consultare fonti esterne. Ed è qui che entra in gioco il RAG.

RAG: dare all'AI i tuoi documenti

RAG sta per Retrieval-Augmented Generation — Generazione Aumentata dal Recupero. Il nome è brutto, il concetto è semplice.

Immagina uno studente che deve rispondere a una domanda d'esame. Può fare in due modi:

  1. Rispondere a memoria — rischia di sbagliare o inventare
  2. Consultare i libri prima di rispondere — molto più affidabile

Il RAG è il secondo approccio applicato all'AI. Invece di rispondere solo dalla sua "memoria" (i dati di addestramento), il modello prima cerca informazioni rilevanti in una base di documenti, poi genera la risposta usando quelle informazioni come riferimento.

Come funziona, passo per passo

  1. Indexing. I tuoi documenti (PDF, pagine web, email, database) vengono spezzati in pezzi e convertiti in rappresentazioni matematiche chiamate embedding — vettori numerici che catturano il significato del testo. Questi vengono salvati in un database vettoriale.

  2. Retrieval. Quando fai una domanda, il sistema converte anche la tua domanda in un embedding e cerca nel database i pezzi di documenti più simili — quelli che probabilmente contengono la risposta.

  3. Generation. I pezzi di documenti trovati vengono inseriti nel prompt del modello, che genera la risposta basandosi su quelle informazioni specifiche.

Il risultato: un'AI che risponde basandosi sui tuoi dati, con informazioni aggiornate, e che può citare le fonti.

Dove lo trovi già

  • Perplexity: cerca sul web in tempo reale e genera risposte con citazioni. È essenzialmente un RAG sul web.
  • ChatGPT con file: quando carichi un documento e fai domande, ChatGPT usa un sistema simile al RAG.
  • Claude con documenti: stessa cosa — carichi PDF, pagine web, codice, e Claude risponde basandosi su quei contenuti.
  • NotebookLM (Google): carichi documenti e crea un chatbot specializzato su quei contenuti.
  • Applicazioni aziendali: sempre più aziende creano chatbot interni che rispondono basandosi sulla documentazione aziendale.

Agenti AI: quando l'AI decide da sola

Un agente AI è un sistema che non si limita a generare testo — prende decisioni e compie azioni per raggiungere un obiettivo.

La differenza fondamentale:

  • Chatbot tradizionale: tu chiedi, lui risponde. Punto.
  • Agente AI: tu dai un obiettivo, lui decide quali passi fare, li esegue, verifica il risultato, e continua finché non ha finito.

Un esempio concreto: "Organizza un viaggio a Barcellona per il weekend del 15 marzo per 2 persone, budget 800€."

Un chatbot ti darebbe suggerimenti. Un agente potrebbe (con i permessi giusti): cercare voli, confrontare prezzi, cercare hotel, verificare disponibilità, controllare il meteo, suggerire attività, e preparare un itinerario completo — facendo decine di ricerche e decisioni intermedie senza chiederti niente.

Il loop di un agente

Un agente lavora in un ciclo:

  1. Osserva — analizza la situazione attuale e l'obiettivo
  2. Pensa — decide quale azione compiere
  3. Agisce — esegue l'azione (cerca sul web, scrive codice, chiama un'API)
  4. Valuta — controlla il risultato
  5. Ripete — se non ha raggiunto l'obiettivo, torna al punto 1

Questo loop è ciò che rende gli agenti potenti e, allo stesso tempo, rischiosi. Un agente che prende decisioni sbagliate può concatenare errori e produrre disastri — ecco perché i sistemi attuali hanno ancora molto supervisione umana.

Agenti che esistono oggi

Claude Code (Anthropic). Un agente per programmatori: gli dai un obiettivo ("aggiungi la funzionalità X al progetto") e lui naviga il codice, scrive modifiche, testa, corregge errori, il tutto in autonomia dal terminale.

Cursor e altri IDE AI. Editor di codice dove l'AI non solo suggerisce ma può scrivere, refactorare e debuggare interi file.

Operator (OpenAI). Un agente che naviga il web: può compilare form, fare acquisti, prenotare ristoranti — usando un browser come farebbe un umano.

Computer Use (Anthropic). Claude che controlla direttamente il computer: muove il mouse, clicca, digita. Può usare qualsiasi software come farebbe una persona.

Siamo all'inizio dell'era degli agenti. I sistemi attuali funzionano bene per compiti specifici e ben definiti, ma fanno ancora fatica con obiettivi vaghi, situazioni impreviste e task che richiedono giudizio complesso.

Function calling / Tool use: l'AI che usa strumenti

Il tool use (o function calling) è il meccanismo che permette a un'AI di usare strumenti esterni — e il punto è che è il modello a decidere quale strumento usare e quando.

Funziona così:

  1. Lo sviluppatore definisce una lista di "tool" disponibili (funzioni che il modello può chiamare), ognuno con una descrizione di cosa fa
  2. L'utente fa una domanda
  3. Il modello analizza la domanda e decide se serve un tool e quale
  4. Il modello "chiama" il tool con i parametri appropriati
  5. Il tool restituisce il risultato
  6. Il modello usa il risultato per formulare la risposta

Esempio pratico: un chatbot per il meteo.

  • Tool disponibili: get_weather(city, date), get_forecast(city, days)
  • L'utente chiede: "Pioverà a Roma domani?"
  • Il modello decide di usare get_forecast("Roma", 1)
  • Il tool restituisce i dati meteo
  • Il modello risponde: "Domani a Roma è prevista pioggia nel pomeriggio, con temperature intorno ai 18°C"

Il modello non "conosce" il meteo — ma sa usare lo strumento giusto per trovare l'informazione.

Questo meccanismo è alla base di quasi tutte le applicazioni AI moderne: chatbot che interrogano database, assistenti che mandano email, tool che analizzano fogli Excel.

MCP: lo standard per connettere tutto

MCP (Model Context Protocol) è uno standard aperto creato da Anthropic per connettere i modelli AI a servizi e strumenti esterni in modo unificato.

Il problema che risolve: ogni servizio (Google Drive, Slack, GitHub, il tuo database) ha la sua API con il suo formato. Senza uno standard, integrare un'AI con 10 servizi diversi richiede 10 integrazioni custom — un incubo.

MCP crea un protocollo comune: un modo standard per dire all'AI "ecco i tool disponibili, ecco come usarli, ecco i dati che puoi consultare". Qualsiasi servizio che implementa MCP diventa automaticamente utilizzabile dall'AI.

L'analogia: USB. Prima di USB, ogni dispositivo aveva il suo connettore proprietario. USB ha creato uno standard universale. MCP vuole fare lo stesso per le connessioni AI-servizi.

In pratica, con MCP puoi:

  • Connettere Claude ai tuoi Google Drive, Slack, GitHub
  • Far sì che l'AI legga email, documenti, codice
  • Permettere all'AI di compiere azioni: creare task, mandare messaggi, aggiornare database
  • Il tutto con un protocollo unificato e sicuro

MCP è ancora relativamente nuovo ma sta diventando rapidamente uno standard de facto nell'industria.

Mettere tutto insieme

Le tecnologie di questo capitolo si combinano:

  • RAG dà all'AI accesso ai tuoi dati
  • Tool use permette all'AI di compiere azioni
  • MCP standardizza le connessioni
  • Agenti orchestrano tutto per raggiungere obiettivi complessi

Un agente moderno potrebbe: ricevere la tua richiesta, consultare i tuoi documenti (RAG), usare strumenti per raccogliere informazioni esterne (tool use), prendere decisioni basate su tutto il contesto, e eseguire azioni concrete — il tutto connesso via MCP.

È un cambio di paradigma: dall'AI come "enciclopedia intelligente" all'AI come "assistente che lavora per te".

I limiti attuali

Entusiasmo a parte, è importante essere onesti sui limiti:

Affidabilità. Gli agenti commettono errori. Un agente che sbaglia un passaggio può concatenare errori nei passaggi successivi. La supervisione umana è ancora necessaria per task importanti.

Sicurezza. Un agente con accesso a email, file e strumenti è potente — ma anche rischioso. Cosa succede se un prompt malevolo lo convince a fare qualcosa di sbagliato? La sicurezza degli agenti è un campo di ricerca attivo.

Costo. Un agente che fa 20 chiamate al modello per completare un task costa 20 volte una singola risposta. Per task complessi, i costi possono salire rapidamente.

Latenza. Un agente che deve fare ricerche, consultare tool e ragionare a ogni passaggio è inevitabilmente più lento di una risposta diretta.

In pratica 🎯

Prova il RAG in azione senza scrivere una riga di codice:

Opzione 1 — ChatGPT:

  1. Prendi un documento che hai (un PDF di lavoro, un report, un articolo lungo)
  2. Caricalo nella chat di ChatGPT (icona della graffetta)
  3. Chiedi: "Riassumimi i punti chiave di questo documento"
  4. Poi chiedi qualcosa di specifico: "Nella sezione sui costi, qual è il budget previsto?"
  5. Nota come risponde basandosi sul documento, non sulla sua conoscenza generale

Opzione 2 — NotebookLM:

  1. Vai su NotebookLM (gratuito con account Google)
  2. Carica 2-3 documenti su un argomento
  3. Fai domande che richiedono di incrociare informazioni tra i documenti
  4. Nota come cita le fonti specifiche nelle risposte

Hai appena usato il RAG. Ora immagina la stessa cosa applicata a tutta la documentazione della tua azienda, al tuo archivio email, al tuo codice sorgente. Capisci perché è un game changer?

Risorse correlate

  • 📖 Glossario: RAG, Embedding, Vector Database, Agente AI, Function Calling, Tool Use, MCP, API
  • 📄 Doc: ChatGPT (file upload, GPTs), Claude (documenti, MCP), Perplexity (RAG web)
  • 🔧 Tool: NotebookLM, Perplexity, ChatGPT, Claude
DomandaEmbeddingVector DBDocumentiLLM + ContestoRisposta

Non hai capito qualcosa?

Chiedi a un chatbot AI. Abbiamo preparato il prompt per te con il contesto di questa lezione.

Si aprirà in una nuova scheda con il prompt pronto