ARTFEED — Contemporary Art Intelligence

Il Routing Controfattuale Riduce le Allucinazioni nei Modelli MoE

ai-technology · 2026-04-30

È stato sviluppato un nuovo framework di inferenza, denominato Routing Controfattuale (CoR), per affrontare le allucinazioni nei modelli Sparse Mixture-of-Experts (MoE), specialmente quando si ha a che fare con conoscenze a coda lunga. Lo studio, disponibile su arXiv (2604.14246), rivela che il routing statico Top-k tende a privilegiare schemi frequenti rispetto a connessioni fattuali meno comuni, causando l'inattività di 'esperti specializzati' che hanno un significato causale. CoR impiega un'analisi delle perturbazioni a livello di layer insieme alla metrica Counterfactual Expert Impact (CEI) per riallocare le risorse computazionali dai layer guidati dalla sintassi a quelli focalizzati sulla conoscenza, mantenendo invariato il numero totale di attivazioni. Questo metodo mira ad attivare esperti dormienti e ridurre le allucinazioni senza richiedere addestramento aggiuntivo.

Fatti principali

  • Il Routing Controfattuale (CoR) è un framework di inferenza senza addestramento
  • Affronta le allucinazioni nei modelli Sparse Mixture-of-Experts (MoE)
  • Pubblicato su arXiv con identificatore 2604.14246
  • Il routing statico Top-k fa sì che i router favoriscano schemi ad alta frequenza
  • Gli esperti specializzati con conoscenze a coda lunga rimangono dormienti
  • CoR utilizza l'analisi delle perturbazioni a livello di layer e la metrica Counterfactual Expert Impact (CEI)
  • Sposta dinamicamente le risorse computazionali dai layer dominanti di sintassi a quelli intensivi di conoscenza
  • Mantiene costante il numero totale di attivazioni

Entità

Istituzioni

  • arXiv

Fonti