L'apprendimento attivo ottimizza la comunicazione nei sistemi multi-agente basati su LLM
Un nuovo studio da arXiv (2605.05703) propone un framework di apprendimento attivo per ottimizzare le strutture di comunicazione nei sistemi multi-agente basati su grandi modelli linguistici (LLM-MAS). I metodi esistenti si basano su compiti di training casuali, che variano in difficoltà e dominio, portando a un'ottimizzazione instabile con budget limitati. Gli autori introducono un framework di selezione dei compiti basato sulla teoria dell'informazione e su ensemble, che stima l'informatività di un compito misurando come un compito candidato modifica la distribuzione sui parametri del grafo. Utilizzano l'inversione di Kalman ensemble come approssimazione efficiente e senza derivate dell'aggiornamento bayesiano. Questo approccio mira a migliorare le prestazioni a valle e a ridurre l'uso di token, identificando i compiti più preziosi per aggiornare le strutture di comunicazione.
Fatti principali
- Il paper arXiv 2605.05703 propone l'apprendimento attivo per l'ottimizzazione della struttura di comunicazione in LLM-MAS.
- I metodi esistenti utilizzano compiti di training campionati casualmente, causando un'ottimizzazione instabile.
- Il framework utilizza la selezione dei compiti basata su ensemble e teoria dell'informazione.
- L'informatività del compito è stimata dalla variazione nella distribuzione sui parametri del grafo.
- L'inversione di Kalman ensemble fornisce un'approssimazione bayesiana efficiente e senza derivate.
- L'obiettivo è migliorare le prestazioni a valle e ridurre l'uso di token.
- Il metodo affronta budget di training limitati e variabilità dei compiti.
- Il framework identifica attivamente i compiti più preziosi per gli aggiornamenti della struttura.
Entità
Istituzioni
- arXiv