News

OpenAI vince medaglia d'oro olimpiadi informatica: come il sistema ha raggiunto il podio

Punti salienti dell'articolo:
  • OpenAI oro olimpiadi informatica: primo tra le IA e top human virtuale
  • Il sistema ha usato un ensemble di modelli generalisti
  • Generazione, compilazione ed esecuzione reali per verificare soluzioni
  • Nessun accesso a internet o RAG durante la gara
  • Vincoli: 5 ore al giorno e massimo 50 submission per problema
  • Salto netto rispetto al 2024 grazie a search e self‑verification
  • Implicazioni per strumenti di coding e automazione di ingegneria
  • Risultato importante ma non sinonimo di sostituzione dei programmato
OpenAI vince medaglia d'oro olimpiadi informatica: come il sistema ha raggiunto il podio

Introduzione

OpenAI oro olimpiadi informatica: il sistema di ragionamento di OpenAI ha conquistato l'oro nella track AI dell'International Olympiad in Informatics (IOI), posizionandosi primo tra le intelligenze artificiali e al sesto posto virtuale tra 330 partecipanti umani. Questo risultato mostra un progresso significativo nella capacità dei modelli generici di risolvere problemi algoritmici sotto regole di gara reali.

Contesto

L'IOI è la finale mondiale di programmazione per liceali: due giorni di gara, tre problemi al giorno, 5 ore per sessione, nessun accesso a internet e soluzioni valutate su test nascosti. Nel 2025 hanno partecipato 330 concorrenti da 84 paesi; il massimo punteggio totale era 600 e il taglio per l'oro è stato 438.30, raggiunto da soli 28 studenti.

Metodo usato da OpenAI

Il sistema non era un modello specializzato per IOI, ma un ensemble di modelli general‑purpose. Durante la gara il sistema ha generato programmi candidati, compilato ed eseguito codice in un terminale limitato come un concorrente umano, e ha selezionato le submission migliori entro il limite di 50 invii e 5 ore. Non è stato usato internet né retrieval‑augmented generation (RAG); l'approccio è essenzialmente ricerca a test‑time + self‑verification con compilazione reale e giudici automatici.

Dettagli operativi

  • Ensemble di modelli di ragionamento generalisti
  • Generazione di candidate programmatiche e verifica eseguendo compilazioni e test
  • Selezione delle migliori submission nel vincolo di 50 invii
  • Funzionamento senza RAG o accesso esterno

Il salto rispetto al 2024

Nella versione 2024 OpenAI aveva un sistema dedicato ("o1-ioi") che in gara segnò 213 punti (circa 49° percentile). Successive prove sui problemi 2024 con un modello generalista ("o3") raggiunsero 395.64 punti rispettando la regola dei 50 invii, superando così la soglia d'oro per quell'anno. Nel 2025 l'ensemble generale ha ottenuto un punteggio che lo collocherebbe circa al sesto posto tra i 330 concorrenti umani e primo tra le IA, l'equivalente di posizionarsi nel top ~2% degli umani.

Perché questo conta

Il progresso indica che migliori strategie di ricerca, loop di feedback più stretti e selezione delle soluzioni possono permettere a modelli generalisti di risolvere compiti algoritmici non visti prima, entro vincoli temporali e di submission tipici della competizione. Questo approccio è rilevante anche per strumenti di ingegneria del software che devono produrre codice affidabile sotto vincoli operativi.

Limiti e considerazioni

Il risultato è significativo ma non implica che le IA sostituiscano i programmatori: le gare IOI testano specifiche abilità di problem solving algoritmico in condizioni controllate. I limiti includono la necessità di un processo di search e verifica al test‑time e l'assenza di spiegazioni certificate sul perché una soluzione è corretta oltre i test eseguiti.

 

FAQ

  • Quanto ha ottenuto il sistema di OpenAI all'IOI 2025?
    OpenAI ha partecipato alla track AI del 2025 posizionandosi primo tra le IA e vicino al sesto posto tra i 330 umani, equivalente al livello oro.
  • Cosa significa "ensemble" nel contesto dell'IOI di OpenAI?
    Significa che il sistema combinava più modelli generalisti per generare candidate di programma e scegliere la submission migliore tramite verifica e test.
  • OpenAI ha usato internet o RAG durante la gara?
    No: la competizione è stata eseguita senza accesso a internet o retrieval‑augmented generation.
  • In cosa consiste il miglioramento dal 2024 al 2025?
    Il sistema è passato da una pipeline più specializzata (213 punti nel 2024) a modelli generalisti con search e self‑verification che superano la soglia d'oro in test successivi e nella track AI 2025.
  • Che impatto ha questo risultato sugli strumenti di sviluppo?
    Migliori tecniche di search e verifica a test‑time possono rendere i modelli più validi per automazione di coding e tool di ingegneria che richiedono soluzioni corrette e verificabili.
  • Quali sono i vincoli pratici rilevanti nella gara IOI per valutare questo risultato?
    I vincoli principali sono il limite di 5 ore per sessione, massimo 50 submission per problema e la valutazione su test nascosti senza supporto esterno.
Introduzione OpenAI oro olimpiadi informatica: il sistema di ragionamento di OpenAI ha conquistato l'oro nella track AI dell'International Olympiad in [...] Evol Magazine
Tag:
OpenAI