TACT: Steering dell'Attivazione per Ridurre l'Eccesso di Pensiero e di Azione negli Agenti di Codifica
I ricercatori hanno presentato TACT (Think-Act Calibration via activation Steering), una tecnica volta a identificare e affrontare la deriva dell'agente negli agenti basati su modelli linguistici durante estesi processi di ingegneria del software. La deriva dell'agente si manifesta in due forme: eccesso di pensiero, che comporta un ragionamento eccessivo su informazioni familiari, ed eccesso di azione, caratterizzato da chiamate a strumenti senza considerare nuovi dati. Esaminando gli stati nascosti nel flusso residuo, i ricercatori hanno scoperto che i passaggi classificati come eccesso di pensiero, eccesso di azione o calibrati si allineano linearmente lungo due assi di deriva (AUC ≈ 0.9). Durante i test, TACT mappa l'attivazione di ogni passaggio su questi assi, correggendo gli stati derivati per ripristinare un comportamento calibrato. Il documento di ricerca è disponibile su arXiv con ID 2605.05980.
Fatti principali
- TACT sta per Think-Act Calibration via activation Steering.
- La deriva dell'agente è definita come degrado lungo traiettorie lunghe negli agenti di codifica.
- Due modalità di fallimento sono l'eccesso di pensiero e l'eccesso di azione.
- Gli stati nascosti dei passaggi della traiettoria si separano linearmente lungo due assi di deriva.
- L'AUC della separazione è di circa 0.9.
- TACT proietta le attivazioni sugli assi di deriva al momento del test.
- Il metodo riporta le attivazioni derivate verso un comportamento calibrato.
- Il documento è su arXiv con ID 2605.05980.
Entità
Istituzioni
- arXiv