PARA: Compressione di LoRA senza dati tramite allocazione adattiva dei ranghi

ai-technology · 2026-05-01

arXiv:2604.27796 introduce Post-Optimization Adaptive Rank Allocation (PARA), un metodo senza dati per comprimere modelli Low-Rank Adaptation (LoRA) potando i ranghi utilizzando la decomposizione ai valori singolari con una soglia globale. A differenza del LoRA standard che utilizza un rango uniforme su tutti i livelli, PARA alloca ranghi non uniformi basati sull'importanza spettrale a livello di strato, riducendo il numero di parametri del 75-90% mantenendo le prestazioni predittive. Come tecnica post-hoc, evita modifiche all'addestramento e instabilità comuni nelle architetture dinamiche. Il metodo si integra perfettamente nei pipeline di fine-tuning esistenti senza richiedere dati aggiuntivi o riaddestramento. I risultati empirici dimostrano una compressione significativa con una perdita di accuratezza minima, affrontando la ridondanza dei parametri nei grandi modelli di base.

Fatti principali

PARA è un metodo di compressione senza dati per LoRA
Utilizza la decomposizione ai valori singolari con soglia globale
Alloca ranghi non uniformi basati sull'importanza spettrale a livello di strato
Riduce il numero di parametri del 75-90%
Preserva le prestazioni predittive
Metodo post-hoc che evita modifiche all'addestramento
Si integra nei pipeline di fine-tuning esistenti
Affronta la ridondanza dei parametri nei modelli di base

Entità

—

Fonti

arXiv cs.AI — 2026-05-01