Il Framework SAVOIR Utilizza la Teoria dei Giochi per Addestrare Agenti Linguistici Socialmente Intelligenti

ai-technology · 2026-04-22

Uno studio recente intitolato "SAVOIR: Learning Social Savoir-Faire via Shapley-based Reward Attribution" introduce un framework innovativo mirato a potenziare l'intelligenza sociale negli agenti linguistici. Questa ricerca affronta il dilemma dell'assegnazione del credito nell'apprendimento per rinforzo all'interno di dialoghi multi-turno, dove risulta difficile valutare l'impatto delle singole affermazioni sui risultati complessivi. Gli approcci attuali che utilizzano modelli linguistici per la distribuzione delle ricompense sono criticati per essere retrospettivi e privi di solide basi teoriche. Il framework SAVOIR sfrutta la teoria dei giochi cooperativi, in particolare i valori di Shapley, per garantire un'assegnazione equa del credito con proprietà assiomatiche di efficienza, simmetria e marginalità. Incorpora inoltre i principi dell'utilità attesa, spostando l'attenzione dalla valutazione retrospettiva a quella prospettica per valutare il potenziale di un enunciato nel favorire esiti futuri vantaggiosi. Questo articolo, catalogato come arXiv:2604.18982v1, evidenzia l'intelligenza sociale come una sfida chiave per gli agenti linguistici.

Fatti principali

L'articolo propone il framework SAVOIR per addestrare agenti linguistici socialmente intelligenti.
SAVOIR affronta il problema dell'assegnazione del credito nell'apprendimento per rinforzo per dialoghi multi-turno.
Il framework è basato sulla teoria dei giochi cooperativi e utilizza i valori di Shapley.
I valori di Shapley forniscono garanzie assiomatiche di efficienza, simmetria e marginalità per la distribuzione del credito.
L'approccio combina i valori di Shapley con il principio dell'utilità attesa.
L'utilità attesa sposta la valutazione dall'attribuzione retrospettiva alla valutazione prospettica.
Gli approcci esistenti sono criticati come retrospettivi e privi di fondamento teorico.
L'articolo è identificato come arXiv:2604.18982v1 ed è annunciato come nuovo.

Entità

—

Fonti

arXiv cs.AI — 2026-04-22