Modello di Ricompensa Cumulativa Consapevole dello Schema per il Question Answering su Grafi di Conoscenza
È stato proposto un nuovo modello di IA, SCPRM (Modello di Ricompensa Cumulativa Consapevole dello Schema), per migliorare il ragionamento nel question answering su grafi di conoscenza. I grandi modelli linguistici affrontano sfide nella valutazione dei passaggi intermedi di ragionamento a causa di un effetto di compensazione del rischio, dove passaggi errati possono essere compensati da quelli corretti successivi, portando a ricompense elevate per percorsi imperfetti. Questo problema è particolarmente critico in domini sensibili al rischio come il ragionamento su grafi di conoscenza medici e legali, dove esistono percorsi multipli tra entità. SCPRM affronta questo problema condizionandosi sul prefisso di ragionamento e incorporando la distanza di schema tra il passaggio corrente e il target implicito estratto dalla query, fornendo ricompense cumulative e future. Il modello mira a migliorare l'affidabilità della supervisione passo-passo in compiti di ragionamento complessi.
Fatti principali
- SCPRM sta per Modello di Ricompensa Cumulativa Consapevole dello Schema.
- È progettato per il question answering su grafi di conoscenza.
- I grandi modelli linguistici soffrono di un effetto di compensazione del rischio nel ragionamento.
- Passaggi errati possono essere compensati da passaggi corretti successivi, assegnando ricompense elevate a percorsi imperfetti.
- Percorsi multipli nei KG aggravano il problema.
- I compiti sensibili al rischio includono il ragionamento su KG medici e legali.
- SCPRM si condiziona sul prefisso di ragionamento.
- Incorpora la distanza di schema tra il passaggio corrente e il target implicito.
- Il modello fornisce ricompense cumulative e future.
Entità
—