DockSmith: Agente AI per la Creazione Affidabile di Ambienti Docker
DockSmith è un avanzato costruttore Docker agentico progettato per affrontare le sfide della costruzione di ambienti affidabili per l'addestramento e la valutazione di agenti di ingegneria del software. Considera la creazione di ambienti come un'abilità agentica fondamentale che comprende l'utilizzo a lungo termine di strumenti, il ragionamento sulle dipendenze e il recupero da fallimenti. Utilizzando ampie traiettorie di costruzione Docker da un pipeline in stile SWE-Factory, che include rilevamento di loop e memoria di successo tra compiti, un modello 30B-A3B ha raggiunto risultati leader su Multi-Docker-Eval, registrando un tasso Fail-to-Pass del 39,72% e un tasso Commit del 58,28%. Inoltre, DockSmith migliora le prestazioni in scenari fuori distribuzione.
Fatti principali
- DockSmith è un costruttore Docker agentico per agenti di ingegneria del software.
- Affronta il collo di bottiglia della costruzione affidabile di ambienti Docker.
- L'addestramento utilizza un pipeline in stile SWE-Factory con rilevamento di loop e memoria di successo tra compiti.
- Un modello 30B-A3B raggiunge un tasso Fail-to-Pass del 39,72% e un tasso Commit del 58,28% su Multi-Docker-Eval.
- DockSmith migliora le prestazioni fuori distribuzione.
Entità
Istituzioni
- arXiv