ARTFEED — Contemporary Art Intelligence

CuSearch: Campionamento di Rollout Curriculare per l'Addestramento di RAG Agentico

other · 2026-05-13

CuSearch è un framework proposto per implementare un campionamento di rollout curriculare finalizzato all'addestramento di sistemi di generazione aumentata da recupero (RAG) agentici tramite Apprendimento per Rinforzo con Ricompense Verificabili (RLVR). A differenza degli approcci attuali che considerano tutte le traiettorie uguali, le traiettorie con ricerca più approfondita offrono più punti decisionali di recupero e una supervisione più ricca. Per affrontare la crescente eterogeneità nella profondità di ricerca durante l'addestramento, CuSearch impiega l'Allocazione Greedy basata sulla Profondità di Ricerca (SDGA) per ridistribuire il budget di aggiornamento verso queste traiettorie più profonde. Questo framework è dettagliato nell'articolo arXiv numero 2605.11611.

Fatti principali

  • CuSearch è un framework di campionamento di rollout curriculare per RAG agentico.
  • Utilizza l'Allocazione Greedy basata sulla Profondità di Ricerca (SDGA) per dare priorità alle traiettorie di ricerca più profonde.
  • RLVR viene utilizzato per l'addestramento da supervisione basata solo sui risultati.
  • Le traiettorie di ricerca più profonde forniscono una supervisione più densa per la sotto-politica di recupero.
  • Il campionamento uniforme dei rollout ignora l'eterogeneità di profondità che cresce durante l'addestramento.
  • L'articolo è disponibile su arXiv con ID 2605.11611.

Entità

Istituzioni

  • arXiv

Fonti