VineLM: Selezione Fine-Grained di Modelli per Workflow Agentici
Un nuovo gestore di workflow chiamato VineLM consente un controllo fine-grained sulle fasi LLM nei workflow agentici. A differenza dei gestori esistenti che assegnano un modello statico per workflow, VineLM seleziona i modelli per ogni invocazione di fase in base a obiettivi runtime come accuratezza, costo o latenza. Utilizza un trie di prefissi di scelta del modello e checkpointing per stimare le prestazioni senza profilazione esaustiva. A runtime, ri-radica il trie dopo ogni fase e ri-pianifica dinamicamente. L'articolo è disponibile su arXiv.
Fatti principali
- VineLM è un gestore di workflow per workflow agentici
- Seleziona i modelli per ogni invocazione di fase a runtime
- Gli obiettivi includono massimizzare l'accuratezza sotto budget di costo o latenza
- Utilizza un trie annotato di prefissi di scelta del modello
- Impiega checkpointing e profilazione a cascata per la stima
- Ri-radica il trie dopo ogni invocazione di fase
- Articolo disponibile su arXiv con ID 2605.23914
- Tipo di annuncio: cross
Entità
Istituzioni
- arXiv