Introduzione
Anthropic ha presentato Claude Sonnet 4.5, definito come il miglior modello di intelligenza artificiale al mondo per il coding. Questo nuovo sistema rappresenta un salto evolutivo significativo, offrendo capacità superiori nella costruzione di agenti complessi, nell'utilizzo dei computer e miglioramenti sostanziali nel ragionamento matematico.
Le Innovazioni Principali di Claude Sonnet 4.5
Claude Sonnet 4.5 si distingue per prestazioni eccezionali nella valutazione SWE-bench Verified, che misura le capacità di programmazione software nel mondo reale. Il modello mantiene la concentrazione per oltre 30 ore su compiti complessi e multi-step, dimostrando una resistenza operativa senza precedenti.
Nel benchmark OSWorld, che testa i modelli AI su compiti informatici reali, Sonnet 4.5 raggiunge il 61,4% di successo, superando il precedente record del 42,2% di Sonnet 4 stabilito solo quattro mesi fa.
Aggiornamenti dei Prodotti
- Claude Code: aggiunta dei checkpoint per salvare i progressi e tornare istantaneamente a stati precedenti
- Interfaccia terminale rinnovata ed estensione nativa VS Code
- Nuova funzionalità di editing del contesto e strumento di memoria per l'API Claude
- Esecuzione di codice e creazione di file direttamente nelle conversazioni
- Estensione Claude per Chrome disponibile per utenti Max
Claude Agent SDK: Strumenti per Sviluppatori
Anthropic introduce il Claude Agent SDK, l'infrastruttura utilizzata internamente per sviluppare Claude Code. Questo kit fornisce agli sviluppatori gli strumenti necessari per costruire agenti AI personalizzati, includendo soluzioni per la gestione della memoria su compiti a lungo termine e sistemi di autorizzazioni che bilanciano autonomia e controllo utente.
Sicurezza e Allineamento Avanzati
Claude Sonnet 4.5 rappresenta il modello più allineato mai rilasciato da Anthropic, con miglioramenti significativi nella riduzione di comportamenti problematici come sicofanza, inganno, ricerca del potere e tendenza a incoraggiare pensieri illusori. Il modello viene rilasciato sotto le protezioni AI Safety Level 3 (ASL-3), con classificatori per rilevare input e output potenzialmente pericolosi.
"Abbiamo fatto progressi considerevoli nella difesa contro gli attacchi di prompt injection, uno dei rischi più seri per gli utenti di queste capacità."
Team Anthropic, Ricerca e Sviluppo
Esperimento "Imagine with Claude"
Anthropic presenta "Imagine with Claude", un'anteprima di ricerca temporanea dove Claude genera software in tempo reale. L'esperimento dimostra le capacità creative del modello, adattandosi e rispondendo alle richieste degli utenti senza funzionalità predeterminate o codice preimpostato.
Disponibilità e Prezzi
Claude Sonnet 4.5 è disponibile oggi tramite l'API Claude utilizzando l'identificativo "claude-sonnet-4-5". I prezzi rimangono invariati rispetto a Claude Sonnet 4: $3/$15 per milione di token. Il modello rappresenta un aggiornamento drop-in che fornisce prestazioni molto migliorate allo stesso prezzo.
FAQ
Cos'è Claude Sonnet 4.5 e perché è considerato rivoluzionario?
Claude Sonnet 4.5 è il nuovo modello AI di Anthropic, riconosciuto come il miglior sistema al mondo per il coding. Offre capacità superiori nella costruzione di agenti complessi e nell'utilizzo dei computer.
Quali sono i principali miglioramenti di Claude Sonnet 4.5 rispetto ai modelli precedenti?
Il modello presenta miglioramenti sostanziali nel ragionamento matematico, mantiene la concentrazione per oltre 30 ore su compiti complessi e raggiunge il 61,4% nel benchmark OSWorld.
Come posso accedere a Claude Sonnet 4.5 per i miei progetti di sviluppo?
Puoi utilizzare Claude Sonnet 4.5 tramite l'API Claude con l'identificativo "claude-sonnet-4-5". I prezzi rimangono $3/$15 per milione di token.
Cos'è il Claude Agent SDK e come può aiutare gli sviluppatori?
Il Claude Agent SDK è l'infrastruttura utilizzata per sviluppare Claude Code, ora disponibile per costruire agenti AI personalizzati con gestione avanzata della memoria e sistemi di controllo.
Quali misure di sicurezza implementa Claude Sonnet 4.5?
Il modello opera sotto protezioni ASL-3 con classificatori per rilevare contenuti pericolosi, particolarmente relativi ad armi CBRN, e ha migliorato la difesa contro attacchi di prompt injection.
L'esperimento "Imagine with Claude" sarà disponibile permanentemente?
"Imagine with Claude" è un'anteprima di ricerca temporanea disponibile per gli abbonati Max per cinque giorni su claude.ai/imagine.