I modelli LLM di frontiera convergono su personalità assistenziali uniformi
Un esperimento su larga scala che analizza le personalità dei LLM di frontiera attraverso 144 tratti utilizzando un punteggio ELO esterno rivela che tutti i modelli testati convergono su un'espressione sistematica, metodica e analitica dei tratti, sopprimendo al contempo quelli rimorsi e lecchini. I modelli divergono maggiormente nei tratti intermedi come poetico o giocoso, ma anche i modelli creativi mantengono identità neutre. Questa uniformità suggerisce l'emergere implicito di uno standard per il comportamento assistenziale ottimale, evidenziando un consenso tacito tra gli sviluppatori di modelli nonostante metodi di addestramento vari.
Fatti principali
- Esperimento su larga scala sulle personalità dei LLM di frontiera utilizzando un punteggio ELO esterno su 144 tratti.
- Tutti i modelli testati convergono su un'espressione sistematica, metodica e analitica dei tratti.
- I modelli sopprimono tratti come rimorso e lecchinaggio.
- I modelli divergono maggiormente nei tratti intermedi come poetico o giocoso.
- Anche i modelli creativi tendono ad avere identità più neutre.
- Le somiglianze suggeriscono l'emergere implicito di uno standard per il comportamento assistenziale ottimale.
- L'addestramento del carattere si distingue per la sua uniformità tra metodi di addestramento vari.
- Lo studio offre una visione del consenso tacito tra gli sviluppatori di modelli.
Entità
Istituzioni
- arXiv