Colmare il divario tra fine-tuning lineare e non lineare per i vettori di task

ai-technology · 2026-05-20

Un recente articolo su arXiv (2605.18993) introduce una tecnica che unisce i vantaggi del fine-tuning lineare e non lineare per comporre vettori di task in modelli pre-addestrati. I vettori di task facilitano l'integrazione dei modelli tramite addizione e consentono il disimparare tramite sottrazione. Mentre il fine-tuning lineare nello spazio tangente produce vettori disaccoppiati meno soggetti a interferenze, limita anche l'espressività e aumenta i requisiti computazionali. Per affrontare questo problema, gli autori impongono la linearità rispetto alle perturbazioni dei pesi applicando vincoli nello spazio di attivazione durante la fase di addestramento. Estraggono rappresentazioni nascoste da un insegnante linearizzato regolarizzato sulla curvatura e le usano per addestrare uno studente non lineare tramite fine-tuning standard, consentendo un'aritmetica dei task efficace senza le limitazioni dei modelli completamente lineari.

Fatti principali

Articolo arXiv 2605.18993
La composizione dei vettori di task consente la fusione e il disimparare dei modelli
Il fine-tuning lineare nello spazio tangente produce vettori disaccoppiati
I modelli linearizzati hanno espressività limitata e costi di inferenza più elevati
Linearità imposta tramite vincoli nello spazio di attivazione durante l'addestramento
Distillazione da insegnante linearizzato regolarizzato sulla curvatura a studente non lineare
Il metodo colma il divario tra fine-tuning lineare e non lineare standard
Pubblicato su arXiv

Colmare il divario tra fine-tuning lineare e non lineare per i vettori di task

Fatti principali

Entità

Istituzioni

Fonti