ARTFEED — Contemporary Art Intelligence

Co-ReAct: Selezione di Azioni Guidata da Rubriche per Agenti ReAct

other · 2026-05-25

Un nuovo framework chiamato Co-ReAct utilizza rubriche come guida a livello di passo durante l'inferenza per migliorare gli agenti di tipo ReAct in compiti di ragionamento multi-step che richiedono ricerca intensiva. A differenza degli usi precedenti delle rubriche come ricompense in fase di addestramento o valutatori post-hoc, Co-ReAct inietta una rubrica nel contesto dell'agente a ogni passo decisionale per guidare la successiva decisione Reason-or-Act, specificando obiettivi per la ricerca di prove, la ricerca, il ragionamento o l'autovalutazione. Questo affronta i problemi di traiettorie superficiali, ridondanti o mal mirate negli agenti esistenti. L'articolo è disponibile su arXiv con ID 2605.23590.

Fatti principali

  • Co-ReAct è un framework di selezione di azioni guidato da rubriche per agenti ReAct.
  • Le rubriche sono utilizzate come guida a livello di passo durante l'inferenza.
  • Lavori precedenti usavano le rubriche come ricompense in fase di addestramento o valutatori post-hoc.
  • Co-ReAct inietta una rubrica nel contesto dell'agente a ogni passo decisionale.
  • La rubrica guida la successiva decisione Reason-or-Act.
  • Specifica obiettivi per la ricerca di prove, la ricerca, il ragionamento o l'autovalutazione.
  • L'approccio affronta traiettorie superficiali, ridondanti o mal mirate.
  • L'articolo è su arXiv con ID 2605.23590.

Entità

Istituzioni

  • arXiv

Fonti