Il sistema AI IDS raggiunge la verifica formale di sistemi distribuiti
Un nuovo sistema AI, Inductive Deductive Synthesis (IDS), ha generato con successo sistemi distribuiti formalmente verificati, un compito in cui i precedenti agenti di codifica all'avanguardia hanno fallito. IDS sintetizza congiuntamente e incrementalmente implementazione e dimostrazione, imparando dai tentativi falliti per esplorare sistematicamente strategie promettenti. Costruito come sistema LLM agentico, IDS ha raggiunto 7/7 su specifiche di key-value-store distribuito in circa 6,8 ore a un costo di 106 dollari. Al contrario, gli agenti di codifica SOTA Codex con GPT-5.4 e Claude Code con Opus 4.6 hanno avuto successo solo su 2/7 specifiche. Il lavoro affronta una lacuna critica nella capacità dell'IA di fornire garanzie formali di copertura completa, che i soli test non possono garantire, in particolare per proprietà come la coerenza sotto tutte le possibili interleaving di eventi. La verifica formale meccanizzata richiede in genere mesi o anni di lavoro esperto. Il documento è disponibile su arXiv con il titolo "Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems."
Fatti principali
- IDS sintetizza congiuntamente e incrementalmente implementazione e dimostrazione.
- IDS impara dai tentativi falliti per provare sistematicamente strategie promettenti.
- IDS ha raggiunto 7/7 su specifiche di key-value-store distribuito.
- IDS ha impiegato circa 6,8 ore e costato 106 dollari.
- Codex con GPT-5.4 e Claude Code con Opus 4.6 hanno avuto successo solo su 2/7 specifiche.
- La verifica formale garantisce la correttezza sotto tutte le possibili interleaving di eventi.
- La verifica formale meccanizzata richiede in genere mesi o anni di lavoro esperto.
- Il documento è pubblicato su arXiv con identificativo 2605.23109.
Entità
Istituzioni
- arXiv