LoRDBA: Adattatore Binario per il Fine-Tuning On-Device di LLM

ai-technology · 2026-05-26

Un nuovo metodo chiamato LoRDBA (Low-Rank Double-Binary Adaptation) consente un fine-tuning efficiente di modelli linguistici di grandi dimensioni su dispositivi edge. Sostituisce le due matrici a basso rango in un adattatore LoRA standard con matrici di segno binarie e fattori di scala leggeri per canale, convertendo il forward pass dell'adattatore in moltiplicazioni di accumulo di segni. Ciò elimina la necessità di un ramo denso in virgola mobile, riducendo memoria e calcolo. L'analisi teorica mostra che la qualità della ricostruzione dipende dal rapporto residuo-magnitudine dei fattori LoRA originali. Gli esperimenti dimostrano che LoRDBA supera le baseline a basso bit a dimensioni del modello corrispondenti in modalità adattatore.

Fatti principali

LoRDBA sostituisce i fattori a basso rango di LoRA con portatori di segno binari e scale per canale
Elimina il ramo denso in virgola mobile dell'adattatore
Utilizza moltiplicazioni di matrici di accumulo di segni
L'analisi su campioni finiti lega la qualità della ricostruzione al rapporto residuo-magnitudine
Supera le baseline a basso bit a dimensioni del modello corrispondenti
Mirato all'adattamento on-device di modelli linguistici di grandi dimensioni
Mantiene la compatibilità con LoRA
Pubblicato su arXiv come 2605.24058

LoRDBA: Adattatore Binario per il Fine-Tuning On-Device di LLM

Fatti principali

Entità

Istituzioni

Fonti