Il framework EmoDistill insegna ai LLM strategie emotive nella negoziazione avversariale
Un recente studio presenta EmoDistill, un sistema offline progettato per instillare capacità di negoziazione emotiva negli agenti basati su modelli linguistici. Pubblicato su arXiv, la ricerca indica che il linguaggio carico di emozioni può influenzare considerevolmente i risultati in negoziazioni competitive, posizionando l'emozione come un mezzo tattico piuttosto che una mera scelta stilistica. Il framework suddivide la strategia emotiva in due parti: un selettore Implicit Q-Learning (IQL) per scegliere le emozioni e una politica basata su Low-Rank Adaptation (LoRA) per esprimerle, utilizzando Supervised Fine-Tuning (SFT) e Judge Policy Optimization (JPO). I risultati, che impiegano il prompting affettivo basato su GoEmotions, rivelano che i LLM post-addestrati, solitamente ottimizzati per cortesia e sicurezza, sono suscettibili alla manipolazione emotiva durante le negoziazioni. Il documento è accessibile su arXiv:2605.26785.
Fatti principali
- EmoDistill è un framework offline per la distillazione di abilità di negoziazione emotiva.
- Il prompting affettivo basato su GoEmotions è stato utilizzato per studiare l'effetto dell'emozione sulla negoziazione.
- L'emozione modifica sostanzialmente i risultati della negoziazione in contesti avversariali.
- Il framework scompone la strategia in selezione dell'emozione ed espressione dell'emozione.
- Il selettore Implicit Q-Learning (IQL) apprende quale emozione esprimere.
- La politica basata su Low-Rank Adaptation (LoRA) apprende come esprimere l'emozione.
- Vengono utilizzati Supervised Fine-Tuning (SFT) e Judge Policy Optimization (JPO).
- I LLM post-addestrati sono vulnerabili al linguaggio emotivo nella negoziazione.
Entità
Istituzioni
- arXiv