L'Allineamento Umano Raggiunge il Picco nell'Addestramento Generativo-Discriminativo Intermedio
Un nuovo studio su arXiv (2605.23819) indaga se comprendiamo meglio le rappresentazioni visive simili a quelle umane attraverso l'apprendimento discriminativo o generativo, affrontando problemi riscontrati in ricerche passate. Il team ha utilizzato modelli basati sull'energia congiunta (JEM) che fondono entrambi i metodi in un unico quadro, permettendo di osservare come l'obiettivo di apprendimento influenzi i risultati modificando un singolo coefficiente di miscelazione. Hanno testato questo su sei benchmark relativi all'allineamento umano, come la similarità percettiva e la percezione della lucentezza. I risultati hanno mostrato che l'allineamento umano raggiungeva il picco in punti moderati della scala generativo-discriminativa, suggerendo che un approccio equilibrato è più efficace per creare rappresentazioni che assomigliano alla percezione umana.
Fatti principali
- Lo studio utilizza modelli basati sull'energia congiunta (JEM) per interpolare tra addestramento discriminativo e generativo.
- Varia un singolo coefficiente di miscelazione per isolare l'effetto dell'obiettivo di apprendimento.
- Valuta i modelli su sei benchmark di allineamento umano.
- L'allineamento umano è costantemente massimizzato in punti intermedi del continuum.
- Affronta i fattori confondenti di architettura, scala e dati di addestramento in confronti precedenti.
- I benchmark includono similarità percettiva, percezione della lucentezza e incertezza della risposta umana.
- Testa anche robustezza, conflitto di cue forma-trama e attribuzione diagnostica delle caratteristiche.
- Pubblicato su arXiv con ID 2605.23819.
Entità
Istituzioni
- arXiv