NaviAgent: Pianificazione Bilevel per l'Orchestrazione Scalabile di Strumenti nei LLM
NaviAgent introduce un'architettura innovativa per i Large Language Models (LLM) che distingue tra pianificazione dei compiti ed esecuzione degli strumenti attraverso una rappresentazione basata su grafi delle relazioni tra strumenti. Questo design supera la sfida affrontata dai LLM che tipicamente utilizzano gli strumenti singolarmente senza una prospettiva d'insieme, con conseguente accumulo di errori e scalabilità limitata quando si ha a che fare con centinaia o migliaia di strumenti. Nella fase di pianificazione, le decisioni vengono prese per rispondere direttamente, chiedere chiarimenti o assemblare una catena di strumenti. Nel frattempo, la fase di esecuzione impiega un Modello di Navigazione nel Mondo degli Strumenti (TWNM) per catturare le connessioni strutturali e comportamentali tra gli strumenti, facilitando sequenze di invocazione scalabili ed efficaci. Questa metodologia è descritta in un articolo disponibile su arXiv (2506.19500).
Fatti principali
- NaviAgent è un'architettura bilevel per LLM che separa la pianificazione dei compiti dall'esecuzione degli strumenti.
- Utilizza una modellazione basata su grafi delle relazioni tra strumenti.
- Il livello di pianificazione decide se rispondere, chiarire o recuperare una catena di strumenti.
- Il livello di esecuzione utilizza un Modello di Navigazione nel Mondo degli Strumenti (TWNM).
- TWNM codifica le relazioni strutturali e comportamentali tra gli strumenti.
- Mira a ridurre l'accumulo di errori e migliorare la scalabilità.
- L'articolo è disponibile su arXiv con ID 2506.19500.
- L'approccio mira a scalare fino a centinaia o migliaia di strumenti.
Entità
Istituzioni
- arXiv