La riparametrizzazione dell'azione latente aumenta l'efficienza degli agenti LLM
Il framework di riparametrizzazione dell'azione latente (LAR), recentemente introdotto, mira a ridurre i costi di inferenza per gli agenti basati su modelli linguistici di grandi dimensioni (LLM). Apprendendo uno spazio di azioni latenti condensato, LAR consente a ciascuna azione latente di incarnare comportamenti semantici complessi a più passaggi, accorciando efficacemente l'orizzonte decisionale pur mantenendo l'espressività. A differenza delle macro progettate manualmente o dei controllori gerarchici, queste azioni latenti sono derivate dalle traiettorie degli agenti e integrate direttamente nel modello. Questa innovazione affronta una limitazione significativa nella rappresentazione dello spazio delle azioni, migliorando i precedenti miglioramenti a livello di sistema e di ingegneria dei prompt. La ricerca è disponibile su arXiv con il riferimento 2605.18597.
Fatti principali
- LAR sta per Latent Action Reparameterization (Riparametrizzazione dell'azione latente).
- Apprende uno spazio di azioni latenti compatto per agenti LLM.
- Ogni azione latente corrisponde a un comportamento semantico a più passaggi.
- LAR accorcia l'orizzonte decisionale effettivo.
- Preserva l'espressività dello spazio delle azioni originale.
- Le azioni latenti vengono apprese dalle traiettorie degli agenti.
- Il framework si integra direttamente nel modello.
- L'articolo è su arXiv con ID 2605.18597.
Entità
Istituzioni
- arXiv