ARTFEED — Contemporary Art Intelligence

Modello di Ricompensa Cumulativa Consapevole dello Schema per il Question Answering su Grafi di Conoscenza

ai-technology · 2026-05-06

È stato proposto un nuovo modello di IA, SCPRM (Modello di Ricompensa Cumulativa Consapevole dello Schema), per migliorare il ragionamento nel question answering su grafi di conoscenza. I grandi modelli linguistici affrontano sfide nella valutazione dei passaggi intermedi di ragionamento a causa di un effetto di compensazione del rischio, dove passaggi errati possono essere compensati da quelli corretti successivi, portando a ricompense elevate per percorsi imperfetti. Questo problema è particolarmente critico in domini sensibili al rischio come il ragionamento su grafi di conoscenza medici e legali, dove esistono percorsi multipli tra entità. SCPRM affronta questo problema condizionandosi sul prefisso di ragionamento e incorporando la distanza di schema tra il passaggio corrente e il target implicito estratto dalla query, fornendo ricompense cumulative e future. Il modello mira a migliorare l'affidabilità della supervisione passo-passo in compiti di ragionamento complessi.

Fatti principali

  • SCPRM sta per Modello di Ricompensa Cumulativa Consapevole dello Schema.
  • È progettato per il question answering su grafi di conoscenza.
  • I grandi modelli linguistici soffrono di un effetto di compensazione del rischio nel ragionamento.
  • Passaggi errati possono essere compensati da passaggi corretti successivi, assegnando ricompense elevate a percorsi imperfetti.
  • Percorsi multipli nei KG aggravano il problema.
  • I compiti sensibili al rischio includono il ragionamento su KG medici e legali.
  • SCPRM si condiziona sul prefisso di ragionamento.
  • Incorpora la distanza di schema tra il passaggio corrente e il target implicito.
  • Il modello fornisce ricompense cumulative e future.

Entità

Fonti