PathCal: Calibrazione dei Marcatori di Riflessione Consapevole dello Stato per un Ragionamento Efficiente
Un nuovo articolo su arXiv introduce PathCal, un metodo per calibrare i marcatori di riflessione nei Large Reasoning Language Models (LRM). Gli LRM generano lunghe traiettorie di Chain-of-Thought contenenti marcatori come "wait", "but" e "alternatively", che segnalano esitazione, revisione o esplorazione alternativa. Studi precedenti trattavano questi marcatori come un'unica categoria, ma PathCal distingue i loro ruoli funzionali e l'influenza temporale. Attraverso la soppressione per tipo e l'intervento a prefisso fisso, gli autori mostrano che diverse classi di marcatori influenzano in modo distinto l'accuratezza e la lunghezza di generazione. L'approccio mira a migliorare l'efficienza del ragionamento controllando selettivamente questi marcatori durante l'inferenza.
Fatti principali
- L'articolo arXiv 2605.23074 introduce PathCal
- PathCal sta per State-Aware Reflection-Marker Calibration
- Si concentra sui Large Reasoning Language Models (LRM)
- Gli LRM generano lunghe traiettorie di Chain-of-Thought
- I marcatori di riflessione includono 'wait', 'but', 'alternatively'
- I marcatori segnalano esitazione, revisione, esplorazione alternativa
- Studi precedenti trattavano i marcatori come un'unica categoria grossolana
- PathCal conduce soppressione per tipo e intervento a prefisso fisso
Entità
Istituzioni
- arXiv