EngiAI: Framework Multi-Agente per la Progettazione Ingegneristica Guidata da LLM
È stato introdotto un nuovo benchmark e sistema multi-agente chiamato EngiAI per valutare la progettazione ingegneristica guidata da LLM. Il benchmark comprende tre dimensioni: un benchmark di flusso di lavoro con sette stili di prompt mirati a esigenze cognitive come l'uso diretto di strumenti e la disambiguazione semantica; un benchmark di Retrieval-Augmented Generation (RAG) con punteggio a soglia per la selezione dei parametri; e un benchmark HPC per l'orchestrazione end-to-end dell'addestramento ML su un cluster SLURM. EngiAI è un'implementazione di riferimento basata su LangGraph, che coordina sette agenti specializzati attraverso un supervisore. Il framework affronta la mancanza di standard di valutazione per sistemi multi-agente che combinano simulazione, recupero e preparazione alla produzione.
Fatti principali
- EngiAI è un sistema multi-agente per la progettazione ingegneristica guidata da LLM.
- Il benchmark ha tre dimensioni: flusso di lavoro, RAG e HPC.
- Il benchmark di flusso di lavoro include sette stili di prompt.
- Il benchmark RAG utilizza un punteggio a soglia per i contributi di recupero.
- Il benchmark HPC valuta l'orchestrazione dell'addestramento ML su SLURM.
- EngiAI è basato su LangGraph.
- Sette agenti specializzati sono coordinati da un supervisore.
- Il framework è mirato a simulazione, recupero e preparazione alla produzione.
Entità
Istituzioni
- arXiv