ARTFEED — Contemporary Art Intelligence

DockSmith: Agente AI per la Creazione Affidabile di Ambienti Docker

ai-technology · 2026-04-30

DockSmith è un avanzato costruttore Docker agentico progettato per affrontare le sfide della costruzione di ambienti affidabili per l'addestramento e la valutazione di agenti di ingegneria del software. Considera la creazione di ambienti come un'abilità agentica fondamentale che comprende l'utilizzo a lungo termine di strumenti, il ragionamento sulle dipendenze e il recupero da fallimenti. Utilizzando ampie traiettorie di costruzione Docker da un pipeline in stile SWE-Factory, che include rilevamento di loop e memoria di successo tra compiti, un modello 30B-A3B ha raggiunto risultati leader su Multi-Docker-Eval, registrando un tasso Fail-to-Pass del 39,72% e un tasso Commit del 58,28%. Inoltre, DockSmith migliora le prestazioni in scenari fuori distribuzione.

Fatti principali

  • DockSmith è un costruttore Docker agentico per agenti di ingegneria del software.
  • Affronta il collo di bottiglia della costruzione affidabile di ambienti Docker.
  • L'addestramento utilizza un pipeline in stile SWE-Factory con rilevamento di loop e memoria di successo tra compiti.
  • Un modello 30B-A3B raggiunge un tasso Fail-to-Pass del 39,72% e un tasso Commit del 58,28% su Multi-Docker-Eval.
  • DockSmith migliora le prestazioni fuori distribuzione.

Entità

Istituzioni

  • arXiv

Fonti