News

Alibaba rilascia Qwen3-Coder: il nuovo modello AI open-source per la programmazione agente che sfida i leader del settore

Punti salienti dell'articolo:
  • Alibaba lancia Qwen3, una famiglia di modelli AI open-source che sfida i leader proprietari del settore
  • Qwen3-Coder introduce capacità rivoluzionarie per la programmazione agente con architettura da 480 miliardi di parametri
  • I nuovi modelli supportano fino a 1 milione di token in input, permettendo l'analisi di intere codebase
  • Qwen3-235B-A22B-Instruct-2507 supera modelli consolidati come GPT-4o in 14 su 25 benchmark testati
  • L'innovativa tecnica Group Sequence Policy Optimization ottimizza le prestazioni attraverso apprendimento per rinforzo avanzato
  • I modelli sono rilasciati gratuitamente sotto licenza Apache 2.0 per uso commerciale e non commerciale
  • Qwen3-Coder raggiunge il 67% di successo nel benchmark SWE-bench Verified per problemi reali di ingegneria software
  • La release include Qwen Code CLI, uno strumento che permette di delegare compiti di programmazione tramite linguaggio naturale
  • I modelli Qwen hanno già superato 20 milioni di download globali, dimostrando la crescente adozione open-source
  • La competizione tra modelli cinesi open-source e sistemi proprietari occidentali accelera l'innovazione nel settore AI
Alibaba rilascia Qwen3-Coder: il nuovo modello AI open-source per la programmazione agente che sfida i leader del settore

Una nuova era per la programmazione assistita dall'intelligenza artificiale

Il panorama dell'intelligenza artificiale applicata allo sviluppo software sta vivendo una trasformazione radicale. Alibaba ha recentemente presentato una famiglia di modelli linguistici di grandi dimensioni che promette di ridefinire gli standard del settore: Qwen3, con particolare focus sul rivoluzionario Qwen3-Coder.

Questa release rappresenta un passo significativo nell'evoluzione dei modelli AI open-source, posizionandosi come una valida alternativa ai sistemi proprietari dominanti nel mercato della programmazione automatizzata.

Le innovazioni tecnice di Qwen3: tre modelli per esigenze diverse

La nuova generazione di modelli Qwen3 si articola in tre varianti specializzate, ciascuna ottimizzata per specifici casi d'uso:

Qwen3-235B-A22B-Instruct-2507: il modello generale potenziato

Questa versione rappresenta l'evoluzione del modello base, caratterizzata da un'architettura Mixture-of-Experts con 235 miliardi di parametri totali, di cui 22 miliardi attivi simultaneamente. Il modello supporta fino a 262.144 token in input, raddoppiando la capacità di elaborazione rispetto alla versione precedente.

Qwen3-235B-A22B-Thinking-2507: la variante per il ragionamento complesso

Questa versione specializzata integra capacità di ragionamento avanzate, permettendo al modello di affrontare problemi complessi attraverso un processo di analisi strutturato. Sebbene le prestazioni si posizionino a livello intermedio rispetto ai modelli proprietari di ragionamento, rappresenta un importante traguardo per il mondo open-source.

Qwen3-Coder: il futuro della programmazione agente

Il vero protagonista di questa release è Qwen3-Coder, un modello da 480 miliardi di parametri con 35 miliardi attivi, specificamente progettato per eccellere nelle attività di programmazione agente. Supporta fino a 1 milione di token in input, consentendo l'analisi di intere codebase in una singola sessione.

Prestazioni che ridefiniscono gli standard del settore

I risultati ottenuti dai nuovi modelli Qwen3 sono particolarmente impressionanti nei benchmark di riferimento:

  • Qwen3-235B-A22B-Instruct-2507 ha ottenuto le migliori prestazioni in 14 su 25 benchmark testati, superando modelli consolidati come Kimi K2 e GPT-4o
  • Qwen3-Coder ha dimostrato superiorità rispetto ai modelli open-source concorrenti in tutti i 13 benchmark relativi alle capacità agenti
  • Nel benchmark SWE-bench Verified, che valuta la capacità di risolvere problemi reali di ingegneria del software, Qwen3-Coder ha raggiunto un tasso di successo del 67%

"I modelli basati su Qwen hanno già superato i 20 milioni di download a livello globale, dimostrando l'crescente fiducia della comunità di sviluppatori nelle soluzioni open-source."

Innovazioni metodologiche: l'approccio Group Sequence Policy Optimization

Uno degli aspetti più interessanti della nuova generazione Qwen3 risiede nelle innovazioni metodologiche adottate durante la fase di addestramento. Il team di Alibaba ha sviluppato una versione modificata del Group Relative Policy Optimization, denominata Group Sequence Policy Optimization (GSPO), che ha permesso di ottimizzare le prestazioni dei modelli attraverso tecniche di apprendimento per rinforzo avanzate.

Per Qwen3-Coder, in particolare, è stato implementato un processo di addestramento su 7,5 trilioni di token, di cui il 70% costituito da codice, seguito da una fase di apprendimento per rinforzo focalizzata su attività multi-turno con utilizzo di strumenti esterni.

Accessibilità e impatto economico

Un elemento distintivo della strategia di Alibaba è l'approccio all'accessibilità. I modelli sono rilasciati sotto licenza Apache 2.0, garantendo utilizzo gratuito sia per scopi commerciali che non commerciali. I prezzi per l'accesso API sono competitivi:

  1. Qwen3-235B-A22B-Instruct-2507: $0.70/$2.8 per milione di token di input/output
  2. Qwen3-235B-A22B-Thinking-2507: $0.70/$8.4 per milione di token di input/output
  3. Qwen3-Coder: da $1 a $6 per milione di token di input, da $5 a $60 per milione di token di output

Implicazioni strategiche per il mercato dell'AI

La release di Qwen3 rappresenta un momento significativo nell'equilibrio competitivo del settore AI. Mentre aziende statunitensi come OpenAI, Anthropic e Google continuano a dominare con i loro modelli proprietari, la comunità cinese dei modelli open-source sta rapidamente colmando il divario tecnologico.

Questa tendenza potrebbe accelerare l'innovazione nel settore, spingendo tutti i player a investire maggiormente nelle capacità agenti e nella programmazione automatizzata, settori che rappresentano la prossima frontiera dell'intelligenza artificiale applicata.

Strumenti di sviluppo integrati: Qwen Code CLI

Oltre ai modelli, Alibaba ha rilasciato Qwen Code, un'interfaccia a riga di comando che permette agli sviluppatori di delegare compiti di ingegneria all'AI utilizzando il linguaggio naturale. Questo strumento, ottimizzato con prompt personalizzati e protocolli di interazione specifici, sfrutta appieno il potenziale di Qwen3-Coder per la programmazione agente nel mondo reale.

L'integrazione con l'interfaccia Claude Code amplia ulteriormente le possibilità di utilizzo, rendendo più semplice per gli sviluppatori l'esecuzione di attività di programmazione complesse.

Una nuova era per la programmazione assistita dall'intelligenza artificiale Il panorama dell'intelligenza artificiale applicata allo sviluppo software sta [...] Evol Magazine