Compilazione data-centrica riduce le allucinazioni dei LLM nel QA finanziario

ai-technology · 2026-06-01

Un nuovo framework chiamato Data-centric Reasoning Compiler (DCRC) mira alle allucinazioni numeriche nei modelli linguistici di grandi dimensioni (LLM) per il question answering finanziario (FinQA). L'approccio affronta tre sfide persistenti nella generazione aumentata da recupero (RAG): sensibilità al rumore, fragilità di calcolo e crisi di verificabilità. DCRC opera attraverso tre fasi: costruzione di dati avversari, che sintetizza esempi di addestramento per migliorare la robustezza. Il lavoro, pubblicato su arXiv (2605.31064), propone un cambiamento di paradigma data-centrico rispetto ai metodi model-centrici che ottimizzano il retriever o il generatore in isolamento. Il framework mira a migliorare l'affidabilità in applicazioni finanziarie ad alto rischio dove gli errori di ragionamento numerico sono critici.

Fatti principali

DCRC sta per Data-centric Reasoning Compiler
Il framework mira alle allucinazioni numeriche nei LLM
Affronta sensibilità al rumore, fragilità di calcolo e crisi di verificabilità
DCRC utilizza la costruzione di dati avversari come una delle sue fasi
Il lavoro è pubblicato su arXiv con ID 2605.31064
Si concentra sul question answering finanziario (FinQA)
L'approccio è data-centrico piuttosto che model-centrico
RAG (generazione aumentata da recupero) è il metodo di base

Compilazione data-centrica riduce le allucinazioni dei LLM nel QA finanziario

Fatti principali

Entità

Istituzioni

Fonti