MASPO: Ottimizzazione dei Prompt per Sistemi Multi-Agente Basati su LLM
I ricercatori hanno introdotto MASPO, un framework per ottimizzare automaticamente i prompt in sistemi multi-agente basati su LLM. L'innovazione chiave è un meccanismo di valutazione congiunta che valuta i prompt in base al loro contributo al successo degli agenti a valle, non solo alla validità locale. Questo colma il divario tra interazioni locali e obiettivi globali senza etichette di verità assoluta. MASPO utilizza una ricerca a fascio evolutiva basata sui dati per un raffinamento efficiente dei prompt.
Fatti principali
- MASPO è un framework per l'ottimizzazione congiunta dei prompt in sistemi multi-agente basati su LLM.
- Affronta il disallineamento tra obiettivi locali degli agenti e obiettivi olistici del sistema.
- Innovazione centrale: meccanismo di valutazione congiunta che valuta i prompt in base al successo a valle.
- Non si basa su etichette di verità assoluta.
- Utilizza una ricerca a fascio evolutiva basata sui dati.
- Mira a migliorare compiti collaborativi complessi.
- I prompt sono specifici per il ruolo di ciascun agente.
- Il framework è iterativo e automatico.
Entità
Istituzioni
- arXiv