Comet-H: Orchestrazione di LLM per Software di Ricerca con Specifiche in Evoluzione

other · 2026-05-01

Un nuovo preprint su arXiv (2604.27209) identifica due modalità di fallimento nell'uso di modelli linguistici di grandi dimensioni per progetti software di ricerca: l'accumulo di allucinazioni, in cui le affermazioni superano il codice o la teoria, e la desincronizzazione, in cui codice, teoria e modello del mondo del modello perdono allineamento. Gli autori propongono Comet-H, un automa a prompt iterativo che coordina ideazione, implementazione, valutazione, grounding e scrittura dell'articolo come componenti accoppiate di un unico stato del workspace. Un controller seleziona i prompt in base alle lacune del workspace e porta avanti il lavoro incompiuto con un meccanismo di emivita.

Fatti principali

arXiv:2604.27209
Identifica l'accumulo di allucinazioni e la desincronizzazione come modalità di fallimento specifiche dei LM
Propone l'automa a prompt iterativo Comet-H
Coordina ideazione, implementazione, valutazione, grounding e scrittura dell'articolo
Il controller seleziona i prompt in base alle lacune del workspace
Il lavoro incompiuto viene portato avanti con un meccanismo di emivita
Tipo di preprint: cross
Focus su progetti software di ricerca con specifiche in evoluzione

Comet-H: Orchestrazione di LLM per Software di Ricerca con Specifiche in Evoluzione

Fatti principali

Entità

Istituzioni

Fonti