IBM Research mostra che la logica degli agenti riduce l'uso di token LLM di 30x nell'AI aziendale

ai-technology · 2026-06-01

IBM Research dimostra che la logica degli agenti—primitive software come grafi di conoscenza, librerie di analisi dei programmi e algoritmi—può migliorare drasticamente le prestazioni dell'AI aziendale riducendo i costi. I test in quattro domini (modernizzazione del codice legacy, generazione di test, risposta agli incidenti e automazione della conformità) mostrano che gli agenti dotati di logica superano gli approcci basati solo su LLM frontiera. Per la comprensione del codice legacy, IBM watsonx Code Assistant for Z ha raggiunto un consumo di token ~30x inferiore con prestazioni marginalmente superiori. L'agente Aster per la generazione di test ha mostrato un miglioramento del 20-45% nella copertura con un uso di token fino a 15x inferiore. L'agente Instana I3 per l'indagine sugli incidenti ha ottenuto un miglioramento fino a 4.0x rispetto agli agenti ReAct con GPT-5.1. Gli agenti di automazione della conformità hanno aumentato i tassi di successo da cifre singole a +80% utilizzando Claude 4 Sonnet. Ulteriori casi studio includono un agente generalista configurabile per la sanità (CUGA) con miglioramenti di accuratezza del 15-26% e Maximo Condition Insights per la manutenzione di beni fisici che riduce i tempi di analisi del 97%. Questi risultati sono stati presentati a IBM Think 2026 e fanno parte delle piattaforme IBM Concert e IBM Sovereign Core.

Fatti principali

La logica degli agenti riduce lo spazio di contesto LLM utilizzando grafi di conoscenza, algoritmi e librerie di analisi dei programmi.
IBM watsonx Code Assistant for Z ha raggiunto un consumo di token ~30x inferiore per la comprensione del codice legacy.
L'agente Aster per la generazione di test ha mostrato un miglioramento del 20-45% nella copertura con un uso di token fino a 15x inferiore.
L'agente Instana I3 ha ottenuto un miglioramento fino a 4.0x rispetto all'agente ReAct con GPT-5.1 su ITBench.
L'agente di automazione della conformità ha aumentato i tassi di successo da cifre singole a +80% con Claude 4 Sonnet.
L'agente sanitario CUGA ha migliorato l'accuratezza del 15-26% tra le famiglie di modelli.
Maximo Condition Insights ha ridotto i tempi di analisi dei beni del 97% (da 15-20 minuti a 15-30 secondi).
I risultati coprono le piattaforme IBM watsonx, Aster, Instana, Maximo e IBM Concert.

Entità

Istituzioni

IBM
IBM Research
IBM watsonx Code Assistant for Z
IBM Concert
IBM Sovereign Core
IBM Global Real Estate
IBM CIO
Instana
Maximo
MIT
Hugging Face

Fonti

Hugging Face Blog — 2026-06-01