ARTFEED — Contemporary Art Intelligence

Colmare il divario tra fine-tuning lineare e non lineare per i vettori di task

ai-technology · 2026-05-20

Un recente articolo su arXiv (2605.18993) introduce una tecnica che unisce i vantaggi del fine-tuning lineare e non lineare per comporre vettori di task in modelli pre-addestrati. I vettori di task facilitano l'integrazione dei modelli tramite addizione e consentono il disimparare tramite sottrazione. Mentre il fine-tuning lineare nello spazio tangente produce vettori disaccoppiati meno soggetti a interferenze, limita anche l'espressività e aumenta i requisiti computazionali. Per affrontare questo problema, gli autori impongono la linearità rispetto alle perturbazioni dei pesi applicando vincoli nello spazio di attivazione durante la fase di addestramento. Estraggono rappresentazioni nascoste da un insegnante linearizzato regolarizzato sulla curvatura e le usano per addestrare uno studente non lineare tramite fine-tuning standard, consentendo un'aritmetica dei task efficace senza le limitazioni dei modelli completamente lineari.

Fatti principali

  • Articolo arXiv 2605.18993
  • La composizione dei vettori di task consente la fusione e il disimparare dei modelli
  • Il fine-tuning lineare nello spazio tangente produce vettori disaccoppiati
  • I modelli linearizzati hanno espressività limitata e costi di inferenza più elevati
  • Linearità imposta tramite vincoli nello spazio di attivazione durante l'addestramento
  • Distillazione da insegnante linearizzato regolarizzato sulla curvatura a studente non lineare
  • Il metodo colma il divario tra fine-tuning lineare e non lineare standard
  • Pubblicato su arXiv

Entità

Istituzioni

  • arXiv

Fonti