Hera: Coordinamento Dispositivo-Cloud a Livello di Passo per Agenti LLM
I ricercatori propongono Hera, un coordinatore a livello di passo per agenti LLM dispositivo-cloud che affrontano compiti a lungo termine. Utilizza un paradigma di addestramento a due fasi: apprendimento per imitazione per l'avvio a freddo, quindi apprendimento per rinforzo che ottimizza sia il successo del compito che l'uso del cloud. Ciò raggiunge una forte frontiera di Pareto tra prestazioni e costi, affrontando le limitazioni del routing a livello di compito grossolano dei sistemi esistenti.
Fatti principali
- Hera è un coordinatore a livello di passo per agenti LLM dispositivo-cloud.
- Si rivolge a compiti a lungo termine.
- Utilizza addestramento a due fasi: apprendimento per imitazione poi apprendimento per rinforzo.
- Ottimizza il successo del compito e l'efficienza dell'uso del cloud.
- Raggiunge una forte frontiera di Pareto tra prestazioni e costi.
- Affronta le limitazioni del routing a livello di compito grossolano.
- Pubblicato su arXiv con ID 2605.24598.
- Si concentra sul dilemma dispositivo-cloud per agenti LLM.
Entità
Istituzioni
- arXiv