Il framework FT-RAG migliora il ragionamento tabellare nei LLM
Il nuovo framework FT-RAG potenzia il Retrieval-Augmented Generation (RAG) specificamente per il ragionamento complesso su tabelle. I sistemi RAG tradizionali spesso falliscono con informazioni tabellari strutturate a causa della loro granularità di recupero ampia e della mancanza di una profonda comprensione semantica. FT-RAG supera queste sfide scomponendo le tabelle in componenti semantici a livello di entry per formare un grafo strutturato. Utilizza un approccio di espansione dei vicini strutturali per identificare entità semanticamente correlate durante il recupero dal grafo, seguito da una fusione multimodale per l'integrazione del contesto. Per affrontare il problema dei dataset limitati, gli autori presentano Multi-Table-RAG-Lib, un benchmark con 9.870 coppie QA complesse che richiedono l'integrazione di più tabelle e la fusione testo-tabella. Il paper è disponibile su arXiv con ID 2605.01495.
Fatti principali
- FT-RAG è un framework a grana fine per il ragionamento complesso su tabelle.
- Scompone le tabelle in unità semantiche a livello di entry per costruire un grafo strutturato.
- Un meccanismo di espansione dei vicini strutturali trova entità semanticamente connesse.
- La fusione multimodale consolida il contesto dei risultati del recupero tabellare.
- Il benchmark Multi-Table-RAG-Lib include 9.870 coppie QA.
- Il benchmark richiede integrazione multi-tabella e fusione testo-tabella.
- Il paper è su arXiv: 2605.01495.
- FT-RAG migliora i sistemi RAG per dati tabellari strutturati.
Entità
Istituzioni
- arXiv