ARTFEED — Contemporary Art Intelligence

TSCG: La compilazione deterministica di schemi strumentali migliora la precisione nell'uso degli strumenti da parte degli LLM

ai-technology · 2026-05-07

Il compilatore deterministico di nuova concezione, TSCG, affronta le discrepanze tra gli schemi strumentali JSON e i modelli linguistici di piccole dimensioni con 4-14 miliardi di parametri. Framework per agenti di produzione come OpenAI Function Calling, Anthropic Tool Use e MCP utilizzano JSON per gli schemi strumentali che, sebbene ottimizzati per l'elaborazione automatica, non sono interpretati efficacemente dagli LLM, portando a frequenti fallimenti nell'uso degli strumenti in cataloghi di produzione. TSCG trasforma gli schemi JSON in testo strutturato efficiente in termini di token al confine dell'API, eliminando la necessità di accesso al modello, fine-tuning o ricerche runtime. Impiega otto operatori componibili e garantisce un limite formale di compressione di almeno il 51% per schemi ben formati. Nel benchmark TSCG-Agentic-Bench, che include circa 19.000 chiamate su 12 modelli e 5 scenari, TSCG ha migliorato la precisione di Phi-4 14B dallo 0% all'84,4% con 20 strumenti e al 90,3% con 50 strumenti. Ha inoltre raggiunto un rapporto di precisione mantenuta del 108-181% su tre modelli in BFCL. La scomposizione formato-versus-compressione (R²=0,88 → 0,03) indica che la rappresentazione è il fattore chiave.

Fatti principali

  • TSCG è un compilatore deterministico di schemi strumentali per piccoli LLM (4-14 miliardi di parametri).
  • Risolve il disallineamento di protocollo tra schemi JSON e modelli linguistici.
  • Funziona con i framework OpenAI Function Calling, Anthropic Tool Use e MCP.
  • Converte JSON in testo strutturato efficiente in termini di token senza fine-tuning o ricerca runtime.
  • Combina otto operatori componibili con un limite formale di compressione (≥51%).
  • Su TSCG-Agentic-Bench, la precisione di Phi-4 14B è passata dallo 0% all'84,4% con 20 strumenti e al 90,3% con 50 strumenti.
  • Ha raggiunto un rapporto di precisione mantenuta del 108-181% su tre modelli in BFCL.
  • La scomposizione formato-versus-compressione (R²=0,88→0,03) mostra che la rappresentazione è il fattore chiave.

Entità

Istituzioni

  • OpenAI
  • Anthropic
  • MCP
  • BFCL

Fonti