Ortho-Hydra: Risolvere il Bleeding di Stile nel Fine-Tuning LoRA dei DiT

other · 2026-05-07

Un approccio innovativo chiamato Ortho-Hydra affronta il problema del bleeding di stile riscontrato nel fine-tuning LoRA dei transformer di diffusione (DiT) quando si lavora con dataset multi-stile. Il bleeding di stile si verifica quando un singolo residuo a basso rango non riesce a catturare le diverse firme artistiche distinte, portando l'ottimizzatore a convergere sulla loro media. Nel framework HydraLoRA, il mixture-of-experts LoRA sostituisce la proiezione verso l'alto con E teste gestite da un router, ma l'inizializzazione zero causa gradienti identici e routing uniforme, con il risultato che esperti permutazionalmente simmetrici vengono addestrati come un singolo LoRA di rango r a un costo E×. Ortho-Hydra riparametrizza innovativamente questo integrando una base condivisa di Cayley-ortogonale di tipo OFT con sottospazi di output separati per ogni esperto, derivati dai primi (Er) vettori singolari sinistri dei pesi pre-addestrati. Questa disgiunzione garantisce che il punteggio per esperto del router non sia degenere fin dall'inizio, facilitando immediatamente la specializzazione. Il metodo è descritto in un articolo disponibile su arXiv con ID 2605.03252.

Fatti principali

Ortho-Hydra è una riparametrizzazione per il fine-tuning LoRA dei transformer di diffusione.
Affronta il bleeding di stile nel fine-tuning su dati multi-stile.
Il bleeding di stile si verifica quando un singolo residuo a basso rango fa la media di più stili artistici.
Lo stile HydraLoRA utilizza E teste sotto un router ma soffre di routing uniforme a causa dell'inizializzazione zero.
Ortho-Hydra utilizza una base condivisa di Cayley-ortogonale e sottospazi di output disgiunti per ogni esperto.
I sottospazi disgiunti sono ricavati dai primi (Er) vettori singolari sinistri dei pesi pre-addestrati.
Il metodo garantisce punteggi del router non degeneri all'inizializzazione.
L'articolo è disponibile su arXiv con ID 2605.03252.

Ortho-Hydra: Risolvere il Bleeding di Stile nel Fine-Tuning LoRA dei DiT

Fatti principali

Entità

Istituzioni

Fonti