ARTFEED — Contemporary Art Intelligence

Vertex-Softmax: Verifica più stretta dei Transformer tramite ottimizzazione esatta

other · 2026-05-13

Un nuovo metodo chiamato Vertex-Softmax raggiunge il bound valido più stretto possibile per verificare i meccanismi di attenzione dei Transformer sotto vincoli di intervallo sui punteggi pre-softmax. L'approccio dimostra che l'ottimo esatto del problema score-box si trova in un vertice del box dei vincoli, e un teorema di struttura a soglia riduce i candidati ottimi a un numero lineare dopo aver ordinato i coefficienti obiettivo, ottenendo una complessità log-lineare nella lunghezza della sequenza. Integrato in un verificatore stile CROWN, Vertex-Softmax stabilisce un risultato formale di ottimalità, mostrando che ulteriori miglioramenti richiedono strutture aggiuntive come correlazioni dei punteggi o accoppiamento punteggio-valore. L'articolo è disponibile su arXiv con identificatore 2605.10974.

Fatti principali

  • Vertex-Softmax è un nuovo primitivo per la verifica dei Transformer.
  • Raggiunge il bound valido più stretto possibile dai soli intervalli di punteggio.
  • L'ottimo esatto del problema score-box si trova in un vertice del box dei vincoli.
  • Un teorema di struttura a soglia riduce i candidati ottimi a un numero lineare.
  • La complessità è log-lineare nella lunghezza della sequenza.
  • Il risultato formale di ottimalità mostra la necessità di strutture aggiuntive per miglioramenti.
  • Integrato in un verificatore stile CROWN.
  • Articolo disponibile su arXiv: 2605.10974.

Entità

Istituzioni

  • arXiv

Fonti