Teoremi di Impossibilità Dimostrano che i Bias Cognitivi sono Inevitabili nell'IA e negli Umani
Un nuovo articolo su arXiv dimostra che bias cognitivi come l'effetto primacy e l'ancoraggio sono matematicamente inevitabili nei modelli linguistici autoregressivi a causa dei vincoli di masking causale. I teoremi di impossibilità mostrano che il bias di primacy deriva dall'accumulo asimmetrico dell'attenzione, l'ancoraggio emerge dal condizionamento sequenziale con limiti informativi dimostrabili, e la debiasing esatta tramite marginalizzazione delle permutazioni richiede un calcolo di tempo fattoriale. L'approssimazione Monte Carlo è fattibile con un overhead costante per tolleranza. I limiti sono stati validati su 12 LLM all'avanguardia (R² = 0,89; ΔBIC = 16,6 rispetto alla migliore alternativa). Due esperimenti umani pre-registrati (N = 464) confermano che la posizione dell'ancora modula l'entità dell'ancoraggio (d = 0,52). Lo studio suggerisce che certi bias sono architetturalmente necessari sia nell'IA che nell'elaborazione sequenziale umana.
Fatti principali
- Tre teoremi di impossibilità dimostrano che l'effetto primacy, l'ancoraggio e la dipendenza dall'ordine sono architetturalmente necessari nei modelli linguistici autoregressivi.
- Il bias di primacy deriva dall'accumulo asimmetrico dell'attenzione.
- L'ancoraggio emerge dal condizionamento sequenziale con limiti informativi dimostrabili.
- La debiasing esatta tramite marginalizzazione delle permutazioni richiede un calcolo di tempo fattoriale.
- L'approssimazione Monte Carlo è fattibile con un overhead costante per tolleranza.
- La validazione su 12 LLM all'avanguardia ha raggiunto R² = 0,89; ΔBIC = 16,6 rispetto alla migliore alternativa.
- Due esperimenti umani pre-registrati (N = 464) confermano che la posizione dell'ancora modula l'entità dell'ancoraggio (d = 0,52).
- Articolo pubblicato su arXiv con ID 2605.08716.
Entità
Istituzioni
- arXiv