MOCHA: Ricottura Chebyshev Multi-Obiettivo per l'Ottimizzazione delle Skill degli Agenti LLM
Una nuova tecnica nota come MOCHA (Multi-Objective Chebyshev Annealing) è stata sviluppata per migliorare le skill degli agenti LLM rispettando i limiti delle piattaforme. Gli agenti LLM utilizzano skill, specifiche strutturate in linguaggio naturale costituite da artefatti multi-campo vincolati da fattori come campi descrittivi troncati, corpi di istruzioni compatti e finestre di contesto ristrette. Queste limitazioni creano una sfida di ottimizzazione multi-obiettivo, che richiede il miglioramento simultaneo delle prestazioni del compito e della conformità alle restrizioni della piattaforma. Gli attuali ottimizzatori di prompt trascurano questi compromessi o li semplificano in una somma pesata, non riuscendo a catturare soluzioni Pareto-ottimali in aree obiettivo non convesse. MOCHA impiega la scalarizzazione di Chebyshev per un'esplorazione completa del fronte di Pareto, incluse le regioni non convesse, abbinata a una ricottura esponenziale. Questa metodologia è descritta in un articolo disponibile su arXiv (2605.19330v1).
Fatti principali
- 1. MOCHA sta per Multi-Objective Chebyshev Annealing (Ricottura Chebyshev Multi-Obiettivo)
- 2. È progettato per l'ottimizzazione delle skill degli agenti LLM
- 3. Le skill sono specifiche strutturate in linguaggio naturale
- 4. I vincoli della piattaforma includono campi descrittivi troncati e finestre di contesto limitate
- 5. Gli ottimizzatori esistenti usano somme pesate, perdendo le regioni di Pareto non convesse
- 6. MOCHA usa la scalarizzazione di Chebyshev per coprire l'intero fronte di Pareto
- 7. Il metodo combina scalarizzazione con ricottura esponenziale
- 8. Articolo pubblicato su arXiv con ID 2605.19330v1
Entità
Istituzioni
- arXiv