Framework LLM spiega le decisioni del Monte Carlo Tree Search
I ricercatori hanno sviluppato un nuovo framework che utilizza grandi modelli linguistici (LLM) per aiutare a spiegare come l'algoritmo Monte Carlo Tree Search (MCTS) prende decisioni. MCTS è un metodo utilizzato per fare scelte in condizioni di incertezza. Questo nuovo sistema può prendere domande in linguaggio quotidiano e classificarle in categorie chiare. Verifica le prove nell'albero di ricerca e lo espande quando necessario. Le spiegazioni generate si basano su varie statistiche dell'albero, come conteggi delle visite e dati di rischio. Questo approccio elimina la necessità di regole logiche specifiche che richiedono aggiornamenti costanti, offrendo una soluzione flessibile per comprendere alberi di ricerca complessi utilizzando metodi bandit e simulazione per la valutazione del valore.
Fatti principali
- Il framework consente agli LLM di generare spiegazioni basate su prove delle decisioni MCTS a partire da tracce di ricerca registrate.
- Mappa domande in linguaggio naturale a un insieme strutturato di categorie di intento.
- Determina se l'albero esistente contiene prove sufficienti.
- Attiva l'espansione mirata quando necessario.
- Utilizza statistiche dell'albero come conteggi delle visite, stime di valore e informazioni sul rischio.
- Elimina la necessità di vincoli logici formali creati manualmente.
- Affronta la difficoltà di interpretare alberi di ricerca asimmetrici per gli utenti finali.
- Pubblicato su arXiv con ID 2605.16524.
Entità
Istituzioni
- arXiv