ARTFEED — Contemporary Art Intelligence

Sistema Multi-Agente Basato su LLM per la Riparazione Autonoma di Test dell'Interfaccia Utente

other · 2026-05-06

Uno studio di caso industriale ha valutato un framework di test autonomo multi-agente che utilizza un grande modello linguistico, l'orchestrazione LangGraph, Playwright per l'esecuzione e una base di conoscenza RAG. Questo sistema passa dal test guidato dall'uomo a un approccio ad alta autonomia per scoprire funzionalità ed eseguire test. Senza obiettivi di test predefiniti, ha identificato più di 100 funzionalità testabili su 10 schermate dell'interfaccia utente e ha aumentato dinamicamente la copertura di ulteriori 15-30 funzionalità attraverso l'analisi DOM in fase di esecuzione. Inoltre, ripara iterativamente i test falliti in modo autonomo. L'analisi ha coperto 300 report consecutivi di esecuzione autonoma, che includevano 636 esecuzioni di test distinti su 10 distribuzioni.

Fatti principali

  • Sistema di test autonomo multi-agente valutato in uno studio di caso industriale
  • Basato su LLM con orchestrazione LangGraph, esecuzione Playwright e base di conoscenza RAG
  • Scopre oltre 100 funzionalità testabili su 10 schermate UI senza obiettivi espliciti
  • Espande dinamicamente la copertura di 15-30 funzionalità attraverso l'analisi DOM in fase di esecuzione
  • Ripara iterativamente i test falliti senza intervento umano
  • Analizzati 300 report consecutivi di esecuzione autonoma
  • 636 esecuzioni di test individuali su 10 distribuzioni
  • Dati di esecuzione anonimizzati da un prototipo di test UI enterprise simile alla produzione

Entità

Istituzioni

  • arXiv

Fonti