ARTFEED — Contemporary Art Intelligence

AIPsy-Affect: Batteria di Stimoli per le Emozioni nei Modelli Linguistici

ai-technology · 2026-04-29

AIPsy-Affect, una batteria di stimoli clinici composta da 480 elementi, è stata introdotta dai ricercatori per valutare il riconoscimento delle emozioni nei grandi modelli linguistici senza fare affidamento su parole chiave emotive. Questo strumento affronta un problema significativo nella ricerca sull'interpretabilità meccanicistica: quando una sonda si attiva su 'sono furioso', rimane ambiguo se il modello riconosce la rabbia o semplicemente il termine 'furioso'. La batteria presenta 192 vignette narrative che evocano ciascuna delle otto emozioni primarie di Plutchik senza parole chiave, insieme a 192 scenari di controllo neutri. Include anche suddivisioni per intensità moderata e validità discriminante, consentendo ai ricercatori di distinguere tra vero riconoscimento delle emozioni e identificazione di parole chiave attraverso vari metodi analitici come il probing lineare e l'ablazione causale.

Fatti principali

  • AIPsy-Affect è una batteria di stimoli clinici di 480 elementi.
  • Rimuove il confondimento delle parole chiave emotive a livello di stimolo.
  • Include 192 vignette senza parole chiave per ciascuna delle otto emozioni primarie di Plutchik.
  • Include 192 controlli neutri abbinati.
  • Include suddivisioni per intensità moderata e validità discriminante.
  • Progettata per l'interpretabilità meccanicistica delle emozioni nei modelli linguistici.
  • Affronta probing lineare, patch di attivazione, analisi delle caratteristiche SAE, ablazione causale, estrazione del vettore di steering.
  • Pubblicato su arXiv con ID 2604.23719.

Entità

Istituzioni

  • arXiv

Fonti