ARTFEED — Contemporary Art Intelligence

LoRDBA: Adattatore Binario per il Fine-Tuning On-Device di LLM

ai-technology · 2026-05-26

Un nuovo metodo chiamato LoRDBA (Low-Rank Double-Binary Adaptation) consente un fine-tuning efficiente di modelli linguistici di grandi dimensioni su dispositivi edge. Sostituisce le due matrici a basso rango in un adattatore LoRA standard con matrici di segno binarie e fattori di scala leggeri per canale, convertendo il forward pass dell'adattatore in moltiplicazioni di accumulo di segni. Ciò elimina la necessità di un ramo denso in virgola mobile, riducendo memoria e calcolo. L'analisi teorica mostra che la qualità della ricostruzione dipende dal rapporto residuo-magnitudine dei fattori LoRA originali. Gli esperimenti dimostrano che LoRDBA supera le baseline a basso bit a dimensioni del modello corrispondenti in modalità adattatore.

Fatti principali

  • LoRDBA sostituisce i fattori a basso rango di LoRA con portatori di segno binari e scale per canale
  • Elimina il ramo denso in virgola mobile dell'adattatore
  • Utilizza moltiplicazioni di matrici di accumulo di segni
  • L'analisi su campioni finiti lega la qualità della ricostruzione al rapporto residuo-magnitudine
  • Supera le baseline a basso bit a dimensioni del modello corrispondenti
  • Mirato all'adattamento on-device di modelli linguistici di grandi dimensioni
  • Mantiene la compatibilità con LoRA
  • Pubblicato su arXiv come 2605.24058

Entità

Istituzioni

  • arXiv

Fonti