ARTFEED — Contemporary Art Intelligence

La riparametrizzazione dell'azione latente aumenta l'efficienza degli agenti LLM

other · 2026-05-20

Il framework di riparametrizzazione dell'azione latente (LAR), recentemente introdotto, mira a ridurre i costi di inferenza per gli agenti basati su modelli linguistici di grandi dimensioni (LLM). Apprendendo uno spazio di azioni latenti condensato, LAR consente a ciascuna azione latente di incarnare comportamenti semantici complessi a più passaggi, accorciando efficacemente l'orizzonte decisionale pur mantenendo l'espressività. A differenza delle macro progettate manualmente o dei controllori gerarchici, queste azioni latenti sono derivate dalle traiettorie degli agenti e integrate direttamente nel modello. Questa innovazione affronta una limitazione significativa nella rappresentazione dello spazio delle azioni, migliorando i precedenti miglioramenti a livello di sistema e di ingegneria dei prompt. La ricerca è disponibile su arXiv con il riferimento 2605.18597.

Fatti principali

  • LAR sta per Latent Action Reparameterization (Riparametrizzazione dell'azione latente).
  • Apprende uno spazio di azioni latenti compatto per agenti LLM.
  • Ogni azione latente corrisponde a un comportamento semantico a più passaggi.
  • LAR accorcia l'orizzonte decisionale effettivo.
  • Preserva l'espressività dello spazio delle azioni originale.
  • Le azioni latenti vengono apprese dalle traiettorie degli agenti.
  • Il framework si integra direttamente nel modello.
  • L'articolo è su arXiv con ID 2605.18597.

Entità

Istituzioni

  • arXiv

Fonti