CRANE: Metodo Senza Addestramento Unisce Ragionamento e Uso di Strumenti negli Agenti di Codice
I ricercatori hanno svelato una nuova tecnica chiamata CRANE, acronimo di Constrained Reasoning Injection for Code Agents via Nullspace Editing. Questo metodo consente di modificare i parametri senza richiedere addestramento, combinando checkpoint accoppiati di tipo Instruct e Thinking specificamente per agenti di codice. Il modello Instruct è noto per la sua efficienza e competenza nell'uso degli strumenti, mentre il modello Thinking è bravo a strategizzare ma spesso analizza eccessivamente. CRANE identifica le differenze tra questi due modelli come opportunità per miglioramenti nel ragionamento, applicando metodi come il magnitude thresholding, un Conservative Taylor Gate e una Graduated Sigmoidal Projection per mantenere modifiche benefiche. In sostanza, questo approccio mira ad allineare i punti di forza di entrambi i modelli che di solito sono fuori sincrono. Puoi consultare l'articolo su arXiv con l'identificatore 2605.14084.
Fatti principali
- CRANE sta per Constrained Reasoning Injection for Code Agents via Nullspace Editing.
- È un metodo di modifica dei parametri senza addestramento.
- Fonde checkpoint accoppiati di tipo Instruct e Thinking.
- Il modello Instruct è conciso e disciplinato nell'uso degli strumenti.
- Il modello Thinking offre una pianificazione più forte ma tende a riflettere troppo.
- CRANE utilizza il magnitude thresholding per denotare il delta.
- Il Conservative Taylor Gate mantiene le modifiche congiuntamente benefiche.
- La Graduated Sigmoidal Projection sopprime gli aggiornamenti critici per il formato.
- Articolo disponibile su arXiv: 2605.14084.
Entità
Istituzioni
- arXiv