FD-RAG: Generazione Aumentata da Recupero a Doppio Sistema Federato
È stato introdotto un nuovo framework noto come FD-RAG (Generazione Aumentata da Recupero a Doppio Sistema Federato) per superare le sfide affrontate dai sistemi RAG tradizionali negli ambienti di edge computing. A differenza del RAG standard, che si basa su conoscenze centralizzate e risorse computazionali significative, FD-RAG è progettato per contesti decentralizzati in cui la conoscenza è dispersa tra dispositivi, la condivisione dei dati grezzi non è fattibile e le frequenti chiamate LLM sono costose. Questo framework separa l'accesso alla memoria leggero dal ragionamento LLM su richiesta. Sviluppa ipergrafi adattivi semantico-consapevoli dai dati locali e li comprime in memorie QA efficienti. Durante l'inferenza, FD-RAG utilizza il matching diretto della memoria per query ben coperte e ricorre al ragionamento LLM solo quando necessario, assicurando che le tracce delle memorie recuperate siano allineate con le prove basate su ipergrafi. Inoltre, consolida le statistiche di memoria anonimizzate tra i dispositivi per affrontare la frammentazione della conoscenza, promuovendo un RAG efficiente e attento alla privacy negli scenari edge.
Fatti principali
- FD-RAG è un framework RAG a doppio sistema federato.
- Separa l'accesso alla memoria leggero dal ragionamento LLM su richiesta.
- Apprende ipergrafi adattivi semantico-consapevoli su corpora locali.
- Distilla gli ipergrafi in memorie QA compatte.
- All'inferenza, utilizza il matching diretto della memoria per query ben coperte.
- Invoca il ragionamento LLM solo quando necessario.
- Le memorie recuperate sono tracciate a prove basate su ipergrafi.
- Aggrega statistiche di memoria anonimizzate tra i dispositivi per mitigare la frammentazione della conoscenza.
Entità
—