Agenti basati su LLM allineati con i valori sociali tramite il framework GraphRAG
Un nuovo framework basato sui valori che utilizza GraphRAG converte i principi in istruzioni per agenti basati su LLM, migliorando l'allineamento con i valori sociali umani. Il metodo, testato sul benchmark DAILYDILEMMAS, supera i basati su prompt come ECoT, Plan-and-Solve e Metacognitive prompting. Definisce i comportamenti attesi dalla Gerarchia dei bisogni di Maslow e dalla Ruota delle emozioni di Plutchik, consentendo l'emergere di auto-emozioni nei sistemi di IA.
Fatti principali
- Il framework impiega GraphRAG per convertire i principi in istruzioni basate sui valori
- Testato sul benchmark DAILYDILEMMAS
- Supera ECoT, Plan-and-Solve e Metacognitive prompting
- Definisce i comportamenti attesi dalla Gerarchia dei bisogni di Maslow e dalla Ruota delle emozioni di Plutchik
- Fornisce le basi per l'emergere di auto-emozioni nei sistemi di IA
Entità
Istituzioni
- arXiv