ARTFEED — Contemporary Art Intelligence

Compilazione data-centrica riduce le allucinazioni dei LLM nel QA finanziario

ai-technology · 2026-06-01

Un nuovo framework chiamato Data-centric Reasoning Compiler (DCRC) mira alle allucinazioni numeriche nei modelli linguistici di grandi dimensioni (LLM) per il question answering finanziario (FinQA). L'approccio affronta tre sfide persistenti nella generazione aumentata da recupero (RAG): sensibilità al rumore, fragilità di calcolo e crisi di verificabilità. DCRC opera attraverso tre fasi: costruzione di dati avversari, che sintetizza esempi di addestramento per migliorare la robustezza. Il lavoro, pubblicato su arXiv (2605.31064), propone un cambiamento di paradigma data-centrico rispetto ai metodi model-centrici che ottimizzano il retriever o il generatore in isolamento. Il framework mira a migliorare l'affidabilità in applicazioni finanziarie ad alto rischio dove gli errori di ragionamento numerico sono critici.

Fatti principali

  • DCRC sta per Data-centric Reasoning Compiler
  • Il framework mira alle allucinazioni numeriche nei LLM
  • Affronta sensibilità al rumore, fragilità di calcolo e crisi di verificabilità
  • DCRC utilizza la costruzione di dati avversari come una delle sue fasi
  • Il lavoro è pubblicato su arXiv con ID 2605.31064
  • Si concentra sul question answering finanziario (FinQA)
  • L'approccio è data-centrico piuttosto che model-centrico
  • RAG (generazione aumentata da recupero) è il metodo di base

Entità

Istituzioni

  • arXiv

Fonti