BALAR: Il Ciclo Agente Bayesiano Migliora il Ragionamento Attivo degli LLM
Un nuovo algoritmo chiamato BALAR (Bayesian Agentic Loop for Active Reasoning) consente ai grandi modelli linguistici di condurre interazioni strutturate multi-turno mantenendo credenze sugli stati latenti e selezionando domande chiarificatrici tramite l'informazione mutua attesa. Il metodo outer-loop, agnostico rispetto al compito e senza necessità di fine-tuning, espande dinamicamente le rappresentazioni degli stati quando necessario. Valutato sui benchmark AR-Bench-DC, AR-Bench-SP e iCraft-MD, BALAR ha superato tutte le baseline in compiti che includono casi investigativi, rompicapi logici e diagnosi cliniche.
Fatti principali
- BALAR è un Ciclo Agente Bayesiano per il Ragionamento Attivo
- È un algoritmo outer-loop agnostico rispetto al compito che non richiede fine-tuning
- Mantiene una credenza strutturata sugli stati latenti
- Seleziona domande chiarificatrici massimizzando l'informazione mutua attesa
- Espande dinamicamente la rappresentazione dello stato quando insufficiente
- Valutato sui benchmark AR-Bench-DC, AR-Bench-SP e iCraft-MD
- Supera significativamente tutte le baseline in tutti i benchmark
Entità
Istituzioni
- arXiv