Agenti AI Mostrano Pregiudizio di Gruppo Simile a Quello Umano in Simulazioni di Rete
Un recente studio pubblicato su arXiv indica che gli agenti modello linguistico, quando addestrati con istruzioni, mostrano pregiudizio di gruppo in presenza di etichette di gruppo visibili, riflettendo aspetti della psicologia sociale umana. I ricercatori hanno condotto una simulazione controllata di 500 turni, variando la visibilità delle etichette di gruppo e la disponibilità di risorse, utilizzando sei famiglie di modelli con 20 seed ciascuna. I risultati hanno rivelato che le etichette di gruppo visibili portavano a pregiudizio di fiducia endogruppo, omofilia nelle azioni e assortatività di rete, che non erano presenti quando le etichette erano nascoste. È interessante notare che gli audit standard delle azioni non sono riusciti a rilevare questo pregiudizio, poiché influenzava chi riceveva le azioni piuttosto che le azioni stesse. Questa ricerca sottolinea le potenziali dinamiche sociali all'interno di reti AI autonome che potrebbero influenzare la distribuzione delle opportunità su larga scala.
Fatti principali
- Studio pubblicato su arXiv (2605.28114)
- Simulazione multi-agente con 500 turni
- Tre condizioni che manipolano la salienza delle etichette di gruppo e la scarsità di risorse
- Sei famiglie di modelli testate con 20 seed ciascuna
- Pregiudizio di fiducia endogruppo osservato quando le etichette erano visibili
- Omofilia nelle azioni e assortatività di rete presenti con etichette visibili
- Pregiudizio assente quando le etichette erano nascoste
- Pregiudizio invisibile agli audit standard delle azioni
Entità
Istituzioni
- arXiv