ARTFEED — Contemporary Art Intelligence

L'allocazione attenzionale con budget aumenta l'efficienza dei transformer

other · 2026-05-09

Una nuova tecnica chiamata Budgeted Attention Allocation consente ai transformer di operare a diversi livelli di costo-qualità utilizzando un singolo modello addestrato. Questo metodo incorpora un sistema di gating monotono delle teste basato sul budget di attenzione specificato. È stata evidenziata l'importanza del warm-starting denso per la stabilità. In un compito di sequenze sintetiche, il modello con budget ha registrato un'impressionante accuratezza del 99,7% a un costo di attenzione stimato di 0,303 e ha raggiunto il 100,0% a un costo di 0,504. Per AG News, un transformer personalizzato a livello di parola con adattamento a gate duro ha ottenuto un'accuratezza dell'82,1% e un'accelerazione di 1,28x con un budget di 0,50. Inoltre, il pruning strutturale con budget su un BERT-Mini preaddestrato ha prodotto un'accuratezza dell'87,6% con un'accelerazione di 1,20x allo stesso budget, superando una baseline densa zero-shot post-hoc (86,1%) e avvicinandosi molto a uno specialista per budget dopo un'epoca di recupero (87,9%). L'approccio è stato valutato anche su DBpedia14 utilizzando BERT-Mini.

Fatti principali

  • Budgeted Attention Allocation è un meccanismo di gating monotono delle teste condizionato da un budget di attenzione richiesto.
  • Il warm-starting denso è importante per la stabilità.
  • In un compito di sequenze sintetiche, il modello ha raggiunto il 99,7% di accuratezza a un costo di 0,303 e il 100,0% a un costo di 0,504.
  • Su AG News con un transformer personalizzato a livello di parola, l'adattamento a gate duro ha ottenuto un'accuratezza dell'82,1% con un'accelerazione di 1,28x a un budget di 0,50.
  • Su BERT-Mini preaddestrato per AG News, il pruning strutturale con budget ha raggiunto un'accuratezza dell'87,6% con un'accelerazione di 1,20x a un budget di 0,50.
  • Una baseline strutturale densa zero-shot post-hoc ha raggiunto un'accuratezza dell'86,1%.
  • Un'epoca di recupero ha portato lo specialista per budget all'87,9% di accuratezza.
  • Il metodo è stato testato anche su DBpedia14 con BERT-Mini.

Entità

Istituzioni

  • arXiv

Fonti