Comet-H: Orchestrazione di LLM per Software di Ricerca con Specifiche in Evoluzione
Un nuovo preprint su arXiv (2604.27209) identifica due modalità di fallimento nell'uso di modelli linguistici di grandi dimensioni per progetti software di ricerca: l'accumulo di allucinazioni, in cui le affermazioni superano il codice o la teoria, e la desincronizzazione, in cui codice, teoria e modello del mondo del modello perdono allineamento. Gli autori propongono Comet-H, un automa a prompt iterativo che coordina ideazione, implementazione, valutazione, grounding e scrittura dell'articolo come componenti accoppiate di un unico stato del workspace. Un controller seleziona i prompt in base alle lacune del workspace e porta avanti il lavoro incompiuto con un meccanismo di emivita.
Fatti principali
- arXiv:2604.27209
- Identifica l'accumulo di allucinazioni e la desincronizzazione come modalità di fallimento specifiche dei LM
- Propone l'automa a prompt iterativo Comet-H
- Coordina ideazione, implementazione, valutazione, grounding e scrittura dell'articolo
- Il controller seleziona i prompt in base alle lacune del workspace
- Il lavoro incompiuto viene portato avanti con un meccanismo di emivita
- Tipo di preprint: cross
- Focus su progetti software di ricerca con specifiche in evoluzione
Entità
Istituzioni
- arXiv