Il framework CAST potenzia l'uso degli LLM tramite calibrazione basata su casi
Un nuovo framework chiamato CAST è stato sviluppato dai ricercatori per migliorare l'utilizzo dei modelli linguistici di grandi dimensioni (LLM) regolando la profondità del ragionamento e garantendo la validità strutturale basata su percorsi di esecuzione storici. Invece di fare affidamento su esempi grezzi, CAST analizza la complessità e i modelli di fallimento di casi precedenti per determinare gli approcci di ragionamento più efficaci e prevedere potenziali fallimenti strutturali. Queste informazioni contribuiscono a un sistema di ricompensa sfumato e a un ragionamento adattivo, consentendo al modello di adottare strategie basate sui casi durante l'apprendimento per rinforzo. I test condotti su BFCLv2 e ToolBench indicano che CAST migliora l'esecuzione fedele allo schema e il successo nell'uso degli strumenti a livello di attività, riducendo al minimo la deliberazione non necessaria, con miglioramenti fino al 5,85%. I risultati sono pubblicati in un articolo su arXiv (2605.15041).
Fatti principali
- CAST è un framework basato su casi per l'uso degli strumenti LLM.
- Estrae profili di complessità e fallimento dalle traiettorie di esecuzione storiche.
- Il framework utilizza una progettazione di ricompensa fine e ragionamento adattivo.
- Gli esperimenti sono stati condotti su BFCLv2 e ToolBench.
- CAST migliora l'esecuzione fedele allo schema e il successo a livello di attività.
- Riduce la deliberazione non necessaria.
- L'approccio raggiunge un miglioramento fino al 5,85%.
- L'articolo è disponibile su arXiv (2605.15041).
Entità
Istituzioni
- arXiv