L'evoluzione consapevole dell'insegnante migliora la progettazione euristica degli LLM
Un nuovo preprint arXiv (2605.10634) introduce un framework evolutivo consapevole dell'insegnante per la progettazione automatica di euristiche utilizzando grandi modelli linguistici. Il metodo impiega politiche di ottimizzazione apprese indipendentemente come insegnanti comportamentali, interrogandole sugli stati visitati dai programmi euristici candidati per ottenere feedback locali. Questo approccio combina le prestazioni del compito con i segnali comportamentali derivati dagli insegnanti per guidare l'evoluzione. Esperimenti su benchmark di scheduling, routing e ottimizzazione grafica dimostrano miglioramenti rispetto alle baseline di evoluzione euristica degli LLM guidate dalle prestazioni, senza richiedere inferenza neurale al momento del deployment.
Fatti principali
- Il preprint arXiv 2605.10634 propone un framework evolutivo consapevole dell'insegnante per la progettazione euristica basata su LLM.
- Il metodo utilizza politiche di ottimizzazione apprese come insegnanti comportamentali.
- Gli insegnanti vengono interrogati sugli stati visitati dai programmi euristici candidati.
- Il feedback locale degli insegnanti guida l'evoluzione insieme alle prestazioni del compito.
- Esperimenti su benchmark di scheduling, routing e ottimizzazione grafica.
- Supera le baseline di evoluzione euristica degli LLM guidate dalle prestazioni.
- Non richiede inferenza neurale al momento del deployment.
- Le politiche di ottimizzazione apprese possono essere riutilizzate come feedback comportamentale.
Entità
Istituzioni
- arXiv