Ricerca sulle Politiche Guide-Core per il Controllo di LLM Black-Box Pubblicata su arXiv
Un articolo intitolato "ExecTune: Controllo Efficace di LLM Black-Box con Modelli Guida" è stato reso disponibile su arXiv, identificato da arXiv:2604.09741v1. Questa ricerca indaga le Politiche Guide-Core (GCoP), che coinvolgono un modello guida che genera strategie strutturate per l'esecuzione da parte di modelli linguistici core black-box. Questo metodo affronta la sfida dei costi ricorrenti di inferenza per i grandi modelli linguistici distribuiti tramite API, che spesso superano i costi di addestramento una tantum. Lo studio formalizza le GCoP con un obiettivo di utilità sensibile ai costi, rivelando che le prestazioni complessive dipendono dall'eseguibilità media della guida - la probabilità che il core possa implementare accuratamente le strategie della guida. Gli attuali modelli GCoP generalmente faticano a ottimizzare l'eseguibilità sotto limitazioni di distribuzione, risultando in strategie fragili e inefficienze. L'articolo classifica questi sistemi in metodi base, supervisionati e di tipo advisor, che variano principalmente nelle loro tecniche di addestramento della guida. Considerazioni sui costi guidano lo sviluppo di sistemi agentici composti che convertono ragionamenti costosi in rappresentazioni intermedie riutilizzabili.
Fatti principali
- Articolo di ricerca "ExecTune: Controllo Efficace di LLM Black-Box con Modelli Guida" pubblicato su arXiv
- Identificatore arXiv: arXiv:2604.09741v1
- Studio focalizzato sui sistemi Politiche Guide-Core (GCoP)
- Modelli guida generano strategie strutturate eseguite da modelli core black-box
- Affronta i costi ricorrenti di inferenza che superano i costi di addestramento per LLM API black-box
- Formalizza le GCoP sotto un obiettivo di utilità sensibile ai costi
- Prestazioni governate dalla probabilità di eseguibilità media della guida
- Le attuali istanziazioni GCoP spesso non riescono a ottimizzare l'eseguibilità sotto vincoli di distribuzione
Entità
Istituzioni
- arXiv