ARTFEED — Contemporary Art Intelligence

La compressione dello schema degli strumenti potenzia il RAG agentico con budget di contesto ridotti

other · 2026-05-27

Un nuovo studio su arXiv, intitolato paper 2605.26165, esplora la relazione tra le definizioni dello schema degli strumenti e l'uso della finestra di contesto nei sistemi RAG agentici. I ricercatori hanno valutato 14 modelli linguistici, con dimensioni comprese tra 1,5 e 32 miliardi di parametri, conducendo 6.566 test API controllati su tre diversi budget di contesto: 8K, 16K e 32K, utilizzando 28 definizioni di strumenti. Hanno applicato la compressione con profilo conservativo TSCG, che ha risparmiato il 44-50% dei token dello schema. I risultati hanno rivelato che con 8K token, le definizioni JSON-schema non compresse non potevano essere inserite, portando a quasi nessuna corrispondenza esatta (2,6% in media). Tuttavia, con la compressione, si è registrato un aumento medio significativo delle corrispondenze esatte di +20,5 punti percentuali su tutti i modelli. Questo studio evidenzia il ruolo cruciale della compressione dello schema per un'efficace generazione aumentata da recupero in contesti limitati.

Fatti principali

  • 1. Lo studio valuta 14 modelli linguistici (da 1,5 a 32 miliardi di parametri più un modello API di frontiera)
  • 2. 6.566 chiamate API controllate su tre budget di contesto (8K, 16K, 32K)
  • 3. 28 definizioni di strumenti utilizzate nella valutazione
  • 4. La compressione con profilo conservativo TSCG raggiunge un risparmio del 44-50% nei token dello schema
  • 5. Con 8K token, gli schemi non compressi producono una corrispondenza esatta media del 2,6%
  • 6. Gli schemi compressi forniscono un aumento medio della corrispondenza esatta di +20,5 pp a 8K
  • 7. Tra i sei modelli che mostrano piena abilitazione, l'aumento è di +24,7 pp
  • 8. Con 32K token, quattro dei cinque modelli mostrano una differenza di prestazioni ≤1 pp

Entità

Istituzioni

  • arXiv

Fonti