Vertex-Softmax: Verifica più stretta dei Transformer tramite ottimizzazione esatta
Un nuovo metodo chiamato Vertex-Softmax raggiunge il bound valido più stretto possibile per verificare i meccanismi di attenzione dei Transformer sotto vincoli di intervallo sui punteggi pre-softmax. L'approccio dimostra che l'ottimo esatto del problema score-box si trova in un vertice del box dei vincoli, e un teorema di struttura a soglia riduce i candidati ottimi a un numero lineare dopo aver ordinato i coefficienti obiettivo, ottenendo una complessità log-lineare nella lunghezza della sequenza. Integrato in un verificatore stile CROWN, Vertex-Softmax stabilisce un risultato formale di ottimalità, mostrando che ulteriori miglioramenti richiedono strutture aggiuntive come correlazioni dei punteggi o accoppiamento punteggio-valore. L'articolo è disponibile su arXiv con identificatore 2605.10974.
Fatti principali
- Vertex-Softmax è un nuovo primitivo per la verifica dei Transformer.
- Raggiunge il bound valido più stretto possibile dai soli intervalli di punteggio.
- L'ottimo esatto del problema score-box si trova in un vertice del box dei vincoli.
- Un teorema di struttura a soglia riduce i candidati ottimi a un numero lineare.
- La complessità è log-lineare nella lunghezza della sequenza.
- Il risultato formale di ottimalità mostra la necessità di strutture aggiuntive per miglioramenti.
- Integrato in un verificatore stile CROWN.
- Articolo disponibile su arXiv: 2605.10974.
Entità
Istituzioni
- arXiv