EvoEmo: un framework evolutivo ottimizza le politiche emotive per agenti negoziatori basati su LLM
EvoEmo è stato sviluppato da ricercatori come un framework di apprendimento per rinforzo evolutivo volto a migliorare le espressioni emotive dinamiche durante negoziazioni multi-turno sui prezzi che coinvolgono Large Language Models (LLM). Questo studio, presentato nel preprint arXiv 2509.04310v4, affronta un problema significativo: gli attuali agenti LLM producono reazioni emotive passive guidate dalle preferenze, rendendoli suscettibili alla manipolazione da parte di agenti avversari. EvoEmo concettualizza i cambiamenti di stato emotivo come un Processo Decisionale di Markov e utilizza l'ottimizzazione genetica basata su popolazione per coltivare politiche emotive ad alta ricompensa in vari contesti negoziali. Il framework include anche una baseline per valutare strategie standard rispetto ad approcci a emozione fissa. Questa ricerca apre la strada a risposte emotive più resilienti e strategicamente flessibili in negoziazioni complesse all'interno dell'AI agentica.
Fatti principali
- EvoEmo è un framework di apprendimento per rinforzo evolutivo per agenti LLM.
- Ottimizza l'espressione emotiva dinamica in negoziazioni multi-turno sui prezzi.
- Gli attuali agenti LLM generano risposte emotive passive guidate dalle preferenze.
- EvoEmo modella le transizioni di stato emotivo come un Processo Decisionale di Markov.
- Utilizza l'ottimizzazione genetica basata su popolazione per evolvere politiche emotive.
- La valutazione include baseline con strategie vanilla e a emozione fissa.
- La ricerca è pubblicata su arXiv con ID 2509.04310v4.
- Affronta la vulnerabilità alla manipolazione da parte di controparti avversarie.
Entità
Istituzioni
- arXiv