Modello di Ricompensa Cumulativa Consapevole dello Schema per il Question Answering su Grafi di Conoscenza

ai-technology · 2026-05-06

È stato proposto un nuovo modello di IA, SCPRM (Modello di Ricompensa Cumulativa Consapevole dello Schema), per migliorare il ragionamento nel question answering su grafi di conoscenza. I grandi modelli linguistici affrontano sfide nella valutazione dei passaggi intermedi di ragionamento a causa di un effetto di compensazione del rischio, dove passaggi errati possono essere compensati da quelli corretti successivi, portando a ricompense elevate per percorsi imperfetti. Questo problema è particolarmente critico in domini sensibili al rischio come il ragionamento su grafi di conoscenza medici e legali, dove esistono percorsi multipli tra entità. SCPRM affronta questo problema condizionandosi sul prefisso di ragionamento e incorporando la distanza di schema tra il passaggio corrente e il target implicito estratto dalla query, fornendo ricompense cumulative e future. Il modello mira a migliorare l'affidabilità della supervisione passo-passo in compiti di ragionamento complessi.

Fatti principali

SCPRM sta per Modello di Ricompensa Cumulativa Consapevole dello Schema.
È progettato per il question answering su grafi di conoscenza.
I grandi modelli linguistici soffrono di un effetto di compensazione del rischio nel ragionamento.
Passaggi errati possono essere compensati da passaggi corretti successivi, assegnando ricompense elevate a percorsi imperfetti.
Percorsi multipli nei KG aggravano il problema.
I compiti sensibili al rischio includono il ragionamento su KG medici e legali.
SCPRM si condiziona sul prefisso di ragionamento.
Incorpora la distanza di schema tra il passaggio corrente e il target implicito.
Il modello fornisce ricompense cumulative e future.

Entità

—

Fonti

arXiv cs.AI — 2026-05-05