ARTFEED — Contemporary Art Intelligence

L'allineamento geodetico euclideo previene il collasso della ricerca vettoriale su classi non viste

ai-technology · 2026-05-09

Un nuovo approccio chiamato Allineamento Geodetico Euclideo (EGA) è stato introdotto dai ricercatori come adattatore residuo per encoder visivi statici in applicazioni di ricerca vettoriale. Gli attuali adattatori affrontano problemi di performance fuori distribuzione, dove modelli ad alta capacità che utilizzano perdite contrastive globali classificano erroneamente campioni di classi non viste in cluster di classi viste, portando a un calo della Precisione delle Etichette nel caso peggiore di oltre 40 punti rispetto alla baseline congelata. EGA impiega inizializzazione zero, perdita triplet locale e proiezione su ipersfera, stabilendo una dinamica autolimitante che interrompe la produzione di gradienti per triplette che soddisfano un margine minimo. Alla convergenza, il 96,5% delle triplette rimane privo di gradienti, preservando le aree delle classi non viste mentre consente un raffinamento completo delle classi viste. Questo metodo è descritto in arXiv:2605.05674.

Fatti principali

  • I sistemi di ricerca vettoriale che utilizzano encoder visivi congelati affrontano query da classi non viste in fase di distribuzione.
  • L'addestramento degli adattatori esistenti collassa sotto cambiamento di distribuzione.
  • Gli adattatori ad alta capacità con perdite contrastive globali riducono la Precisione delle Etichette nel caso peggiore di oltre 40 punti.
  • EGA sta per Allineamento Geodetico Euclideo.
  • EGA è un adattatore residuo con tre principi: inizializzazione zero, perdita triplet locale, proiezione su ipersfera.
  • L'adattatore smette automaticamente di aggiornarsi dove la geometria locale è già corretta.
  • Alla convergenza, il 96,5% delle triplette è privo di gradienti.
  • EGA lascia le regioni delle classi non viste in gran parte intatte mentre raffina le classi viste.

Entità

Istituzioni

  • arXiv

Fonti