Controllo a Dominio di Prompt Gerarchico per Modelli Linguistici Agentici con Risorse Limitate
Viene proposto un nuovo framework per il controllo e l'apprendimento di domini di prompt gerarchici in modelli linguistici agentici con risorse limitate. L'approccio prevede la distillazione di un modello compatto per apprendere schemi di output, quindi la sua supervisione online tramite un ciclo oracolo-controllore che monitora la validità del protocollo e le prestazioni semantiche. Il controllore proietta le storie in domini di prompt fattibili e attiva un fine-tuning leggero sotto deriva, separando l'apprendimento dello schema dall'adattamento semantico. Ciò affronta le sfide dell'inaffidabilità dell'estensione del prompt e dei dati e del calcolo limitati per il fine-tuning in fase di deployment.
Fatti principali
- arXiv:2605.27703v1
- Tipo di annuncio: nuovo
- I modelli linguistici di grandi dimensioni sono sempre più utilizzati in sistemi agentici
- Devono seguire protocolli strutturati e adattarsi a stati in evoluzione
- Operano sotto vincoli di memoria, latenza e costo
- L'estensione del prompt è inaffidabile nei modelli compatti
- Il fine-tuning in fase di deployment è limitato da dati e calcolo scarsi
- Framework proposto: controllo e apprendimento gerarchico
- Modello compatto prima distillato per apprendere lo schema di output
- Supervisionato online da un ciclo oracolo-controllore
- Il controllore monitora la validità del protocollo e le prestazioni semantiche
- Proietta le storie accumulate nel dominio di prompt fattibile
- Attiva un fine-tuning leggero supervisionato dall'oracolo sotto deriva
- Separa l'apprendimento dello schema dall'adattamento semantico
Entità
—