Il Framework HER Migliora il Role-Playing degli LLM con Simulazione Cognitiva
I ricercatori propongono HER, un framework unificato per la simulazione della personalità a livello cognitivo nel role-playing degli LLM. HER introduce un pensiero a doppio strato, distinguendo il pensiero in prima persona dei personaggi dal pensiero in terza persona degli LLM. Il framework affronta due carenze chiave: la mancanza di tracce di ragionamento di alta qualità e la mancanza di segnali di ricompensa affidabili allineati alle preferenze umane. Per colmare queste lacune, il team ha curato dati di role-playing potenziati con ragionamento tramite reverse engineering e ha costruito principi allineati all'umano e modelli di ricompensa. Il lavoro è dettagliato nell'articolo arXiv 2601.21459.
Fatti principali
- HER è un framework unificato per la simulazione della personalità a livello cognitivo nel role-playing degli LLM.
- Introduce un pensiero a doppio strato: prima persona dei personaggi vs. terza persona degli LLM.
- Affronta la mancanza di tracce di ragionamento di alta qualità e di segnali di ricompensa affidabili.
- Usa reverse engineering per curare dati di role-playing potenziati con ragionamento.
- Costruisce principi allineati all'umano e modelli di ricompensa.
- Articolo disponibile su arXiv con ID 2601.21459.
- Il role-playing degli LLM è utilizzato in compagnia, creazione di contenuti e giochi digitali.
- I modelli attuali catturano i toni dei personaggi ma faticano con i pensieri interiori.
Entità
Istituzioni
- arXiv