Introduzione
OpenAI ha annunciato il lancio di AgentKit, una suite completa di strumenti progettata per semplificare lo sviluppo, il deployment e l'ottimizzazione di agenti AI. Questa nuova piattaforma rappresenta una svolta per sviluppatori e aziende che finora hanno dovuto affrontare la complessità di strumenti frammentati, orchestrazione complessa senza versionamento, e settimane di lavoro frontend prima del lancio.
AgentKit risponde a queste sfide con un ecosistema integrato che include Agent Builder per la progettazione visuale di workflow, Connector Registry per la gestione centralizzata dei dati, e ChatKit per incorporare esperienze conversazionali nei prodotti. La piattaforma si basa sulle Responses API e Agents SDK rilasciate a marzo, ampliando significativamente le capacità di sviluppo agentico.
Contesto e Necessità del Mercato
Dalla pubblicazione delle API di risposta e dell'SDK per agenti a marzo, OpenAI ha osservato sviluppatori e aziende costruire workflow agentici end-to-end per ricerca approfondita, supporto clienti e altre applicazioni business-critical. Klarna ha sviluppato un agente di supporto che gestisce due terzi di tutti i ticket, mentre Clay ha decuplicato la crescita con un agente di vendita.
Tuttavia, il processo di costruzione rimaneva complesso: orchestrazione frammentata, connettori personalizzati, pipeline di valutazione manuali, ottimizzazione dei prompt e settimane di sviluppo frontend prima del deployment. AgentKit nasce proprio per eliminare questi ostacoli e accelerare il time-to-market.
Agent Builder: Progettazione Visuale dei Workflow
Agent Builder è una canvas visuale che permette di comporre la logica degli agenti attraverso nodi drag-and-drop, connettere strumenti e configurare guardrail personalizzati. Supporta esecuzioni di anteprima, configurazione inline delle valutazioni e versionamento completo, ideale per iterazioni rapide.
Il team di Ramp ha trasformato mesi di orchestrazione complessa in poche ore, riducendo i cicli di iterazione del 70% e lanciando un agente buyer in due sprint invece di due trimestri. La canvas visuale mantiene allineati team di prodotto, legale e ingegneria, accelerando drasticamente lo sviluppo.
"Agent Builder ha trasformato ciò che una volta richiedeva mesi di orchestrazione complessa, codice personalizzato e ottimizzazioni manuali in solo un paio d'ore. La canvas visuale mantiene prodotto, legale e ingegneria sulla stessa pagina, riducendo i cicli di iterazione del 70% e permettendo di lanciare un agente in due sprint piuttosto che due trimestri."
Ramp
LY Corporation, importante azienda tecnologica giapponese, ha costruito un agente assistente di lavoro con Agent Builder in meno di due ore, dimostrando come la piattaforma permetta a ingegneri ed esperti di dominio di collaborare in un'unica interfaccia.
Connector Registry per la Governance Aziendale
Il Connector Registry consolida le fonti dati in un unico pannello amministrativo attraverso ChatGPT e API. Include tutti i connettori pre-costruiti come Dropbox, Google Drive, SharePoint e Microsoft Teams, oltre ai MCP di terze parti. Questo strumento è essenziale per le aziende che devono governare e mantenere dati attraverso workspace e organizzazioni multiple.
Guardrails per la Sicurezza degli Agenti
Gli sviluppatori possono abilitare Guardrails in Agent Builder, un layer di sicurezza modulare open-source che protegge gli agenti da comportamenti non intenzionali o malevoli. Guardrails può mascherare o segnalare informazioni personali, rilevare jailbreak e applicare altre salvaguardie, rendendo più semplice costruire e distribuire agenti affidabili e sicuri.
ChatKit: Incorporare Esperienze Conversazionali
ChatKit è un toolkit che semplifica l'incorporamento di agenti basati su chat nei prodotti. Gestisce automaticamente risposte in streaming, thread di conversazione, visualizzazione del ragionamento del modello e progettazione di esperienze in-chat coinvolgenti. Può essere incorporato in app o siti web e personalizzato per adattarsi al tema o brand aziendale.
Canva ha risparmiato oltre due settimane di tempo nello sviluppo di un agente di supporto per la community Canva Developers, integrandolo in meno di un'ora. L'agente trasforma il modo in cui gli sviluppatori interagiscono con la documentazione, convertendola in un'esperienza conversazionale.
"Abbiamo risparmiato oltre due settimane di tempo costruendo un agente di supporto per la nostra community Canva Developers con ChatKit, e l'abbiamo integrato in meno di un'ora. Questo agente di supporto trasformerà il modo in cui gli sviluppatori interagiscono con la nostra documentazione rendendola un'esperienza conversazionale, facilitando la costruzione di app e integrazioni su Canva."
Canva
ChatKit alimenta già una gamma di casi d'uso, da assistenti di conoscenza interna e guide di onboarding ad agenti di supporto clienti e ricerca. HubSpot ha implementato un agente di supporto clienti utilizzando questa tecnologia.
Nuove Capacità di Valutazione
Costruire agenti affidabili e pronti per la produzione richiede valutazioni rigorose delle prestazioni. OpenAI ha lanciato Evals lo scorso anno per aiutare gli sviluppatori a testare prompt e misurare il comportamento dei modelli. Ora vengono aggiunte quattro nuove funzionalità:
- Datasets: costruire rapidamente valutazioni degli agenti da zero ed espanderle nel tempo con valutatori automatizzati e annotazioni umane
- Trace grading: eseguire valutazioni end-to-end dei workflow agentici e automatizzare la valutazione per identificare carenze
- Automated prompt optimization: generare prompt migliorati basati su annotazioni umane e output dei valutatori
- Third-party model support: valutare modelli di altri provider all'interno della piattaforma OpenAI Evals
Carlyle ha già registrato risultati significativi, riducendo il tempo di sviluppo del framework di due diligence multi-agente di oltre il 50% e aumentando l'accuratezza degli agenti del 30%.
"La piattaforma di valutazione ha ridotto il tempo di sviluppo del nostro framework di due diligence multi-agente di oltre il 50%, e aumentato l'accuratezza degli agenti del 30%."
Carlyle
Reinforcement Fine-Tuning per Prestazioni Avanzate
Il reinforcement fine-tuning (RFT) permette agli sviluppatori di personalizzare i modelli di ragionamento di OpenAI. È generalmente disponibile su o4-mini e in beta privata per GPT-5. OpenAI sta collaborando strettamente con decine di clienti per raffinare RFT per GPT-5 prima del rilascio più ampio.
Due nuove funzionalità sono state introdotte nella beta RFT per spingere ulteriormente le prestazioni degli agenti:
- Custom tool calls: addestrare i modelli a chiamare gli strumenti giusti al momento giusto per un ragionamento migliore
- Custom graders: impostare criteri di valutazione personalizzati per ciò che conta di più nel caso d'uso specifico
Prezzi e Disponibilità
A partire da oggi, ChatKit e le nuove capacità di Evals sono generalmente disponibili per tutti gli sviluppatori. Agent Builder è disponibile in beta, mentre Connector Registry sta iniziando il rollout beta per alcuni clienti API, ChatGPT Enterprise ed Edu con Global Admin Console. Tutti questi strumenti sono inclusi nel pricing standard dei modelli API.
OpenAI prevede di aggiungere presto un'API Workflows standalone e opzioni di deployment degli agenti su ChatGPT.
Conclusione
AgentKit rappresenta un passo significativo nell'evoluzione dello sviluppo di agenti AI, consolidando strumenti precedentemente frammentati in un ecosistema integrato. Con Agent Builder, ChatKit, Connector Registry e funzionalità avanzate di valutazione, OpenAI offre agli sviluppatori e alle aziende gli strumenti necessari per costruire, distribuire e ottimizzare agenti AI in modo più efficiente e affidabile. I risultati ottenuti da aziende come Ramp, Canva, Carlyle e LY Corporation dimostrano il potenziale di questa piattaforma nel ridurre drasticamente i tempi di sviluppo e migliorare le prestazioni degli agenti.
FAQ
Cos'è AgentKit di OpenAI?
AgentKit è una suite completa di strumenti di OpenAI per sviluppare, distribuire e ottimizzare agenti AI, che include Agent Builder, ChatKit, Connector Registry e funzionalità avanzate di valutazione.
Come funziona Agent Builder per gli agenti AI?
Agent Builder è una canvas visuale che permette di progettare workflow multi-agente attraverso nodi drag-and-drop, con supporto per versionamento, esecuzioni di anteprima e configurazione di guardrail di sicurezza.
Quali aziende stanno già utilizzando AgentKit?
Aziende come Ramp, Canva, Carlyle, LY Corporation, HubSpot e Klarna stanno utilizzando gli strumenti di AgentKit per sviluppare agenti AI per vari casi d'uso aziendali.
ChatKit richiede competenze di frontend per essere implementato?
No, ChatKit semplifica l'incorporamento di esperienze conversazionali agentiche gestendo automaticamente streaming, thread e visualizzazione del ragionamento, riducendo significativamente i tempi di implementazione.
Quanto costa utilizzare AgentKit?
Gli strumenti di AgentKit sono inclusi nel pricing standard dei modelli API di OpenAI, senza costi aggiuntivi per ChatKit, Agent Builder o le funzionalità di Evals.
Cosa sono i Guardrails in Agent Builder?
Guardrails è un layer di sicurezza modulare open-source che protegge gli agenti da comportamenti non intenzionali, mascherando informazioni personali e rilevando tentativi di jailbreak.
Come migliorano le prestazioni degli agenti AI le nuove funzionalità di Evals?
Le nuove funzionalità includono datasets per valutazioni rapide, trace grading per assessment end-to-end, ottimizzazione automatizzata dei prompt e supporto per modelli di terze parti.
Il Connector Registry è disponibile per tutti i clienti OpenAI?
Il Connector Registry è in fase di rollout beta per clienti API, ChatGPT Enterprise ed Edu che dispongono di una Global Admin Console per gestire domini e SSO.