Ψ-RAG: Albero Astratto Gerarchico per il Recupero Cross-Documento
I ricercatori propongono Ψ-RAG, un framework di generazione aumentata da recupero basato su albero, progettato per gestire query multi-hop cross-documento. I metodi Tree-RAG esistenti, originariamente costruiti per il recupero su singolo documento, soffrono di scarsa adattabilità distributiva a causa del rumore del clustering k-means, isolamento strutturale privo di connessioni cross-documento e astrazione grossolana che oscura i dettagli fini. Ψ-RAG affronta questi problemi con un indice ad albero astratto gerarchico costruito tramite fusione e collasso iterativi, adattandosi alle distribuzioni dei dati senza assunzioni preliminari, e un agente di recupero multi-granularità che interagisce intelligentemente con l'indice. Il framework mira a scalare RAG per query complesse che abbracciano più documenti.
Fatti principali
- Ψ-RAG è un framework Tree-RAG per il recupero cross-documento
- I metodi Tree-RAG esistenti affrontano sfide nel scalare per domande multi-hop
- I problemi includono scarsa adattabilità distributiva, isolamento strutturale e astrazione grossolana
- Il clustering k-means introduce rumore a causa di assunzioni rigide sulla distribuzione
- Gli indici ad albero mancano di connessioni cross-documento esplicite
- Ψ-RAG utilizza un indice ad albero astratto gerarchico costruito tramite fusione e collasso iterativi
- L'indice si adatta alle distribuzioni dei dati senza assunzioni a priori
- Un agente di recupero multi-granularità interagisce con l'indice
Entità
Istituzioni
- arXiv