PCNET: Un Circuito Probabilistico Rileva le Allucinazioni dei LLM come Anomalie Geometriche
Un team di ricercatori ha introdotto PCNET, un Circuito Probabilistico progettato come stimatore di densità gestibile per il flusso residuo dei LLM, volto a identificare le allucinazioni come irregolarità geometriche all'interno del manifold fattuale. A differenza delle tecniche attuali che regolano indiscriminatamente tutti i token, PCNET utilizza calcoli precisi di Log-Verosimiglianza Negativa per distinguere tra stati nascosti allucinati e fattuali in ogni fase di decodifica, eliminando la necessità di campionamento, validatori esterni o modifiche ai pesi. Questo metodo innovativo agisce come un gate reattivo, avviando correzioni solo al rilevamento di anomalie. Ulteriori dettagli sono disponibili in arXiv:2605.05953v1.
Fatti principali
- PCNET è un Circuito Probabilistico addestrato come stimatore di densità trattabile sul flusso residuo dei LLM.
- Rileva le allucinazioni come anomalie geometriche sul manifold fattuale.
- Il rilevamento utilizza il calcolo esatto della Log-Verosimiglianza Negativa.
- Nessuna necessità di campionamento, verificatori esterni o modifiche ai pesi.
- PCNET agisce come un gate dinamico che distingue gli stati nascosti allucinati da quelli fattuali ad ogni passo di decodifica.
- Gli approcci esistenti applicano correzioni indiscriminatamente a ogni token, corrompendo le generazioni corrette.
- Il metodo è descritto in arXiv:2605.05953v1.
- L'articolo è una sottomissione incrociata.
Entità
Istituzioni
- arXiv