Framework Agentico Costruisce Modelli del Mondo Basati sulla Fisica tramite Codice
Un nuovo articolo su arXiv (2605.14398) introduce un framework agentico che costruisce modelli del mondo basati sulla fisica attraverso codice di simulazione eseguibile, affrontando l'implausibilità fisica dei modelli del mondo basati su video. Il framework coordina quattro agenti: pianificazione, generazione di codice, revisione visiva e analisi fisica. L'agente di pianificazione converte i prompt in linguaggio naturale in piani di scena strutturati, l'agente di codice li implementa come codice di simulazione eseguibile, l'agente di revisione visiva fornisce feedback visivo mentre l'agente di analisi fisica impone vincoli fisici. Questo approccio garantisce dinamiche fisicamente plausibili, evitando contatti instabili, forme distorte o movimenti incoerenti comuni nei modelli basati su video.
Fatti principali
- L'articolo arXiv:2605.14398 introduce un framework agentico per modelli del mondo basati sulla fisica.
- Il framework utilizza codice di simulazione eseguibile invece di stati latenti basati su video.
- Coordina agenti di pianificazione, generazione di codice, revisione visiva e analisi fisica.
- L'agente di pianificazione converte i prompt in linguaggio naturale in piani di scena strutturati.
- L'agente di codice implementa i piani di scena come codice di simulazione eseguibile.
- L'agente di revisione visiva fornisce feedback visivo.
- L'agente di analisi fisica impone vincoli fisici.
- L'approccio mira a generare dinamiche fisicamente plausibili.
Entità
Istituzioni
- arXiv