OSCToM: Metodo Basato su RL per la Teoria della Mente di Alto Ordine negli LLM

ai-technology · 2026-05-22

Un nuovo articolo su arXiv introduce OSCToM (Observer-Self Conflict Theory of Mind), un metodo per generare esempi avversari che testano il ragionamento di Teoria della Mente di alto ordine nei Large Language Models. L'approccio si concentra su conflitti di credenze annidati in cui la visione di un osservatore su un altro agente contraddice lo stato di credenza dell'osservatore stesso, richiedendo un ragionamento ricorsivo a più livelli che va oltre la semplice assunzione di prospettiva. OSCToM combina apprendimento per rinforzo, un linguaggio specifico di dominio esteso e modelli surrogati composizionali per generare questi conflitti. Negli esperimenti, OSCToM-8B ha ottenuto le migliori prestazioni complessive tra i sistemi testati, migliorando i risultati di ExploreToM sul benchmark FANToM. L'articolo è disponibile su https://arxiv.org/abs/2605.20423.

Fatti principali

OSCToM sta per Observer-Self Conflict Theory of Mind.
Il metodo utilizza l'apprendimento per rinforzo per generare esempi avversari.
Si concentra su credenze ricorsive e asimmetrie informative nel ragionamento sociale.
OSCToM-8B ha superato altri sistemi sul benchmark FANToM.
L'approccio estende un linguaggio specifico di dominio per la modellazione composizionale.
I benchmark esistenti come ExploreToM non testano completamente i conflitti di credenze annidati.
L'articolo è stato pubblicato su arXiv con ID 2605.20423.
Il metodo affronta i conflitti di credenza osservatore-sé negli LLM.

OSCToM: Metodo Basato su RL per la Teoria della Mente di Alto Ordine negli LLM

Fatti principali

Entità

Istituzioni

Fonti