IBM Research mostra che la logica degli agenti riduce l'uso di token LLM di 30x nell'AI aziendale
IBM Research dimostra che la logica degli agenti—primitive software come grafi di conoscenza, librerie di analisi dei programmi e algoritmi—può migliorare drasticamente le prestazioni dell'AI aziendale riducendo i costi. I test in quattro domini (modernizzazione del codice legacy, generazione di test, risposta agli incidenti e automazione della conformità) mostrano che gli agenti dotati di logica superano gli approcci basati solo su LLM frontiera. Per la comprensione del codice legacy, IBM watsonx Code Assistant for Z ha raggiunto un consumo di token ~30x inferiore con prestazioni marginalmente superiori. L'agente Aster per la generazione di test ha mostrato un miglioramento del 20-45% nella copertura con un uso di token fino a 15x inferiore. L'agente Instana I3 per l'indagine sugli incidenti ha ottenuto un miglioramento fino a 4.0x rispetto agli agenti ReAct con GPT-5.1. Gli agenti di automazione della conformità hanno aumentato i tassi di successo da cifre singole a +80% utilizzando Claude 4 Sonnet. Ulteriori casi studio includono un agente generalista configurabile per la sanità (CUGA) con miglioramenti di accuratezza del 15-26% e Maximo Condition Insights per la manutenzione di beni fisici che riduce i tempi di analisi del 97%. Questi risultati sono stati presentati a IBM Think 2026 e fanno parte delle piattaforme IBM Concert e IBM Sovereign Core.
Fatti principali
- La logica degli agenti riduce lo spazio di contesto LLM utilizzando grafi di conoscenza, algoritmi e librerie di analisi dei programmi.
- IBM watsonx Code Assistant for Z ha raggiunto un consumo di token ~30x inferiore per la comprensione del codice legacy.
- L'agente Aster per la generazione di test ha mostrato un miglioramento del 20-45% nella copertura con un uso di token fino a 15x inferiore.
- L'agente Instana I3 ha ottenuto un miglioramento fino a 4.0x rispetto all'agente ReAct con GPT-5.1 su ITBench.
- L'agente di automazione della conformità ha aumentato i tassi di successo da cifre singole a +80% con Claude 4 Sonnet.
- L'agente sanitario CUGA ha migliorato l'accuratezza del 15-26% tra le famiglie di modelli.
- Maximo Condition Insights ha ridotto i tempi di analisi dei beni del 97% (da 15-20 minuti a 15-30 secondi).
- I risultati coprono le piattaforme IBM watsonx, Aster, Instana, Maximo e IBM Concert.
Entità
Istituzioni
- IBM
- IBM Research
- IBM watsonx Code Assistant for Z
- IBM Concert
- IBM Sovereign Core
- IBM Global Real Estate
- IBM CIO
- Instana
- Maximo
- MIT
- Hugging Face