Il Framework SELF-EMO Consente agli LLM di Evolvere il Riconoscimento e l'Espressione Emotiva Attraverso il Self-Play
Un nuovo framework di ricerca chiamato SELF-EMO affronta le limitazioni nell'intelligenza emotiva dei grandi modelli linguistici. L'approccio affronta sia il riconoscimento delle emozioni che l'espressione emotiva coerente, due capacità essenziali per le interazioni AI centrate sull'uomo. I sistemi attuali affrontano vincoli dovuti a dati annotati scarsi e statici. Basandosi sull'ipotesi che una migliore previsione emotiva produca risposte emotive più coerenti, il framework introduce due compiti ausiliari: comprensione emotiva ed espressione emotiva. Un paradigma di self-play basato sui ruoli consente ai modelli di funzionare sia come riconoscitori di emozioni che come risponditori dialogici. Attraverso interazioni iterative, vengono generate traiettorie conversazionali diverse, consentendo una produzione di dati scalabile. Per mantenere la qualità, un meccanismo a volano dei dati filtra le previsioni e le risposte candidate utilizzando una ricompensa basata su IoU livellata. Le uscite di alta qualità selezionate vengono quindi reinserite nel processo di addestramento. Questo metodo di auto-evoluzione mira a superare la scarsità di dati creando il proprio materiale di addestramento. Il lavoro è stato annunciato su arXiv con l'identificatore 2604.18003v1. La ricerca si concentra sul Riconoscimento delle Emozioni nella Conversazione (ERC) come capacità fondamentale per i modelli linguistici avanzati.
Fatti principali
- Il framework si chiama SELF-EMO.
- Affronta il Riconoscimento delle Emozioni nella Conversazione (ERC) per gli LLM.
- Affronta sia il riconoscimento delle emozioni che l'espressione emotiva coerente.
- Si basa sull'ipotesi che una migliore previsione emotiva porti a risposte emotive più coerenti.
- Introduce due compiti ausiliari: comprensione emotiva ed espressione emotiva.
- Utilizza un paradigma di self-play basato sui ruoli in cui il modello agisce sia come riconoscitore che come risponditore.
- Genera traiettorie conversazionali diverse per una generazione di dati scalabile.
- Impiega un meccanismo a volano dei dati con una ricompensa basata su IoU livellata per il filtraggio della qualità.
Entità
Istituzioni
- arXiv