News

Claude Advanced Tool Use: 3 Funzioni per Agenti AI Scalabili

Punti salienti dell'articolo:
  • Claude Advanced Tool Use introduce tre funzioni beta per l'orchestrazione degli strumenti
  • Il Tool Search riduce il consumo di token dell'85% caricando strumenti solo on-demand
  • Programmatic Tool Calling permette a Claude di scrivere codice per orchestrare più strumenti
  • I dati intermedi delle chiamate non inquinano più la finestra di contesto del modello
  • Tool Use Examples migliora l'accuratezza dei parametri complessi dal 72% al 90%
  • Ideale per workflow complessi con dozzine di server MCP collegati simultaneamente
  • Disponibile in beta sulla Claude Developer Platform con l'header advanced-tool-use
Claude Advanced Tool Use: 3 Funzioni per Agenti AI Scalabili

Introduzione

Il panorama dello sviluppo di agenti AI sta subendo una trasformazione radicale con l'introduzione del Claude Advanced Tool Use. Anthropic ha recentemente annunciato tre nuove funzionalità in beta progettate per permettere a Claude di scoprire, apprendere ed eseguire strumenti in modo dinamico. Questo aggiornamento risponde a una delle sfide più critiche per gli sviluppatori: la gestione efficiente della finestra di contesto e l'orchestrazione di workflow complessi.

Per costruire agenti efficaci che integrano operazioni Git, manipolazione file e pipeline di deploy, è essenziale che i modelli lavorino con librerie di strumenti illimitate senza dover caricare ogni definizione nel contesto fin dall'inizio. Per approfondimenti tecnici, rimandiamo alla guida ufficiale di Anthropic.

Il Problema: "Context Bloat" e Latenza

Gli agenti moderni devono operare come coordinatori esperti. Tuttavia, l'approccio tradizionale presenta limiti evidenti. Consideriamo uno scenario reale descritto da Anthropic con un setup di 5 server:

  • GitHub: 35 strumenti (~26.000 token)
  • Slack: 11 strumenti (~21.000 token)
  • Sentry, Grafana, Splunk: 12 strumenti combinati (~8.000 token)

In totale, stiamo parlando di 58 strumenti che consumano circa 55.000 token prima ancora che la conversazione inizi. In test interni, alcune configurazioni raggiungevano i 134.000 token. Questo non solo aumenta i costi, ma spinge fuori dalla memoria informazioni vitali.

1. Tool Search Tool: Scoperta Dinamica

La soluzione di Anthropic è il Tool Search Tool. Invece di caricare tutte le definizioni, Claude carica solo uno strumento di ricerca (~500 token). Quando ha bisogno di una capacità specifica, la cerca attivamente.

Caso d'uso specifico: Integrazione GitHub

Se Claude deve interagire con GitHub, invece di avere nel contesto tutti i 35 strumenti (come delete_repo o archive_repo), cerca semplicemente "github". Il sistema restituisce solo gli strumenti rilevanti per il task corrente, come github.createPullRequest e github.listIssues. Gli altri 50+ strumenti di Slack o Jira rimangono scaricati.

Risultato: Una riduzione del consumo di token dell'85% (da ~77k a ~8.7k token nel contesto totale) e un aumento dell'accuratezza del modello Opus 4 dal 49% al 74%.

2. Programmatic Tool Calling: Orchestrazione via Codice

La seconda innovazione affronta l'inefficienza delle chiamate singole. Con il Programmatic Tool Calling, Claude scrive ed esegue codice Python per orchestrare più strumenti in un colpo solo, invece di fare "ping-pong" con l'API per ogni singola richiesta.

Esempio Reale: Controllo Budget Aziendale

Immaginate di dover rispondere alla domanda: "Quali membri del team hanno superato il budget di viaggio nel Q3?". L'approccio tradizionale richiederebbe:

  1. Scaricare la lista del team (20 persone).
  2. Per ogni persona, scaricare le spese (20 chiamate API, migliaia di righe di dati).
  3. Scaricare i limiti di budget.
  4. Far analizzare tutto a Claude nel contesto (oltre 200KB di dati).

Con il Programmatic Tool Calling, Claude scrive uno script che:

  • Chiama get_team_members.
  • Esegue in parallelo get_expenses per tutti.
  • Confronta i totali con get_budget_by_level.
  • Restituisce solo il risultato finale: i nomi di chi ha sforato.

In questo modo, i dati intermedi (voli, hotel, ricevute) non entrano mai nel contesto di Claude. Anthropic cita anche il caso di Claude for Excel, che usa questa tecnica per manipolare fogli di calcolo da migliaia di righe senza sovraccaricare il modello.

3. Tool Use Examples: Apprendimento da Esempi

Le definizioni JSON Schema spesso lasciano ambiguità. Un campo data è YYYY-MM-DD o timestamp? Un ID utente richiede un prefisso?

Il caso dell'API Ticket di Supporto

Anthropic mostra come l'aggiunta di esempi concreti ("input_examples") nella definizione dello strumento risolva queste ambiguità. Nel caso di un tool create_ticket, gli esempi chiariscono che:

  • I bug critici richiedono un oggetto contact completo e parametri di escalation.
  • Le richieste di feature hanno solo il reporter senza contatto.
  • Il formato della data deve essere stringa semplice ("2024-11-06").

Questa chiarezza ha portato l'accuratezza dal 72% al 90% nei test sui parametri complessi.

Conclusione

L'aggiornamento Advanced Tool Use sposta l'intelligenza artificiale dalla semplice esecuzione di comandi all'orchestrazione strategica. Combinando la scoperta on-demand, l'esecuzione programmatica e l'apprendimento few-shot, è ora possibile costruire agenti che gestiscono ecosistemi aziendali complessi con una frazione dei costi e degli errori precedenti.

FAQ: Domande Frequenti

Ecco le risposte alle domande più comuni sulle nuove funzionalità di tool use di Anthropic.

Cos'è esattamente il Claude Advanced Tool Use?

È una suite di tre funzionalità beta (Tool Search, Programmatic Tool Calling, Tool Use Examples) che permette a Claude di gestire migliaia di strumenti in modo efficiente, riducendo l'uso dei token e migliorando l'accuratezza.

Come funziona il Tool Search per risparmiare token?

Invece di caricare tutte le definizioni degli strumenti all'inizio, Claude carica solo un tool di ricerca. Cerca e carica i tool specifici (come quelli di GitHub o Jira) solo quando il task lo richiede, riducendo il contesto occupato fino all'85%.

In che modo il Programmatic Tool Calling migliora le prestazioni?

Permette a Claude di scrivere codice Python per chiamare più strumenti contemporaneamente e processare i dati in un ambiente sandbox. I dati grezzi intermedi non inquinano il contesto del modello, che riceve solo il risultato finale elaborato.

Quando dovrei usare i Tool Use Examples?

Dovresti usarli quando i tuoi strumenti hanno parametri complessi o ambigui che il solo JSON Schema non spiega bene. Gli esempi mostrano a Claude i pattern corretti, migliorando l'accuratezza di compilazione dei campi.

Posso usare queste funzioni con qualsiasi modello Claude?

Attualmente, queste funzionalità sono in beta e ottimizzate per i modelli più recenti sulla Claude Developer Platform (come Sonnet 3.5 o successivi abilitati alla beta), attivabili tramite specifici header API.

Introduzione Il panorama dello sviluppo di agenti AI sta subendo una trasformazione radicale con l'introduzione del Claude Advanced Tool Use. Anthropic ha Evol Magazine