News

Genie 3 di DeepMind: il nuovo modello AI che crea mondi interattivi in tempo reale

Punti salienti dell'articolo:
  • Genie 3 crea mondi interattivi in tempo reale da prompt o immagini
  • Migliorata memoria visiva rispetto a Genie 2
  • Ambienti virtuali modificabili e navigabili dall’utente
  • Strumento di ricerca per l’addestramento di agenti AI
  • Attualmente accessibile solo a ricercatori selezionati
  • Limiti ancora presenti su coerenza e simulazione di luoghi reali

Genie 3: la nuova frontiera dei mondi virtuali generati dall’AI

Google DeepMind ha presentato Genie 3, un modello di intelligenza artificiale capace di creare mondi interattivi e simulazioni in tempo reale partendo da un semplice prompt o da un’immagine. Questo rappresenta un passo avanti significativo rispetto al precedente Genie 2, sia in termini di fedeltà visiva che di memoria e interattività.

Come funziona Genie 3?

Genie 3 permette di generare ambienti virtuali dinamici che possono essere modificati in tempo reale. È possibile aggiungere oggetti, cambiare le condizioni atmosferiche o inserire nuovi personaggi grazie ai cosiddetti “promptable events”. L’utente può navigare questi mondi simulati tramite tastiera, con una fluidità di 24 frame al secondo in risoluzione 720p.

Un potente strumento di ricerca

Oltre alle applicazioni nel gaming, DeepMind vede Genie 3 come uno strumento di ricerca fondamentale. I mondi generati offrono un ambiente ideale per addestrare agenti AI, superando il limite della scarsità di dati reali e permettendo simulazioni praticamente illimitate.

"I modelli di mondo generati dall’AI possono rivoluzionare il modo in cui addestriamo agenti artificiali, offrendo ambienti interattivi e personalizzabili."

DeepMind Research Team

Vantaggi e limiti attuali

  • Memoria estesa: Genie 3 mantiene la coerenza visiva per diversi minuti, superando il limite dei 10 secondi di Genie 2.
  • Fedeltà visiva: Le simulazioni sono più realistiche e dettagliate.
  • Limiti: Il modello non può ancora simulare luoghi reali e può generare elementi errati o incoerenti, come movimenti umani innaturali o testi illeggibili.
  • Interazione agenti AI: Gli agenti possono solo muoversi nel mondo, senza modificarlo attivamente.

Prospettive future

Genie 3 è attualmente accessibile solo a ricercatori selezionati, ma DeepMind prevede di estendere l’accesso in futuro. Le potenzialità di questi modelli sono enormi, sia per la ricerca sull’intelligenza artificiale generale (AGI) che per lo sviluppo di nuovi strumenti creativi e di simulazione.

Genie 3: la nuova frontiera dei mondi virtuali generati dall’AI Google DeepMind ha presentato Genie 3, un modello di intelligenza artificiale capace di [...] Evol Magazine