Livello Runtime Agente Collega Framework LLM e Motori di Servizio
Un nuovo articolo su arXiv (2605.27744) propone di inserire un livello runtime agente tra i framework LLM multi-agente e i motori di servizio per gestire le politiche trasversali. Gli autori sostengono che i sistemi attuali soffrono di una disconnessione: il framework agente conosce identità, ruoli, schemi e struttura di dispatch degli agenti ma non vede mai gli eventi a livello di motore, mentre il motore di servizio vede ogni evento ma non sa nulla degli agenti. Questa discontinuità crea sfide per politiche come la cache dei prefissi, la modellazione dei batch, l'esecuzione speculativa, l'equità, la memoizzazione dei risultati degli strumenti e l'applicazione della sicurezza, attualmente affrontate con patch isolate. La soluzione proposta introduce un terzo livello con quattro primitive—osserva, valuta, predici, agisci—in cui qualsiasi politica consapevole degli agenti può integrarsi, utilizzando l'identità dell'agente come coordinata condivisa. L'articolo mappa nove casi d'uso concreti per dimostrare l'approccio.
Fatti principali
- arXiv:2605.27744 propone un livello runtime agente per il servizio LLM multi-agente.
- Il livello si trova tra il framework agente e il motore di servizio.
- Espone quattro primitive: osserva, valuta, predici, agisci.
- L'identità dell'agente è la coordinata condivisa per le politiche.
- Vengono mappati nove casi d'uso concreti.
- Le politiche attuali sono implementate come patch isolate.
- L'articolo sostiene un cambiamento architetturale anziché correzioni puntuali.
- Le politiche includono cache dei prefissi, modellazione dei batch, esecuzione speculativa, equità, memoizzazione dei risultati degli strumenti e applicazione della sicurezza.
Entità
Istituzioni
- arXiv