La riparametrizzazione dell'azione latente aumenta l'efficienza degli agenti LLM

other · 2026-05-20

Il framework di riparametrizzazione dell'azione latente (LAR), recentemente introdotto, mira a ridurre i costi di inferenza per gli agenti basati su modelli linguistici di grandi dimensioni (LLM). Apprendendo uno spazio di azioni latenti condensato, LAR consente a ciascuna azione latente di incarnare comportamenti semantici complessi a più passaggi, accorciando efficacemente l'orizzonte decisionale pur mantenendo l'espressività. A differenza delle macro progettate manualmente o dei controllori gerarchici, queste azioni latenti sono derivate dalle traiettorie degli agenti e integrate direttamente nel modello. Questa innovazione affronta una limitazione significativa nella rappresentazione dello spazio delle azioni, migliorando i precedenti miglioramenti a livello di sistema e di ingegneria dei prompt. La ricerca è disponibile su arXiv con il riferimento 2605.18597.

Fatti principali

LAR sta per Latent Action Reparameterization (Riparametrizzazione dell'azione latente).
Apprende uno spazio di azioni latenti compatto per agenti LLM.
Ogni azione latente corrisponde a un comportamento semantico a più passaggi.
LAR accorcia l'orizzonte decisionale effettivo.
Preserva l'espressività dello spazio delle azioni originale.
Le azioni latenti vengono apprese dalle traiettorie degli agenti.
Il framework si integra direttamente nel modello.
L'articolo è su arXiv con ID 2605.18597.

La riparametrizzazione dell'azione latente aumenta l'efficienza degli agenti LLM

Fatti principali

Entità

Istituzioni

Fonti