ARTFEED — Contemporary Art Intelligence

La Perdita di Separazione Angolare Migliora la Classificazione VCE Multi-Etichetta

other · 2026-05-25

Un nuovo approccio per il rilevamento di eventi temporali multi-etichetta nella video capsula endoscopica (VCE) affronta il grave squilibrio di classi presente nel dataset Galar. Questa tecnica integra una Perdita di Separazione Angolare applicata ai prototipi di classe con un decodificatore temporale a Macchina a Stati Biologici. Il modello di base utilizzato è BiomedCLIP, che unisce visione e linguaggio biomedico. Per potenziare i segnali patologici transitori riducendo al minimo la ridondanza temporale statica, tre fotogrammi consecutivi vengono combinati utilizzando un modulo di Attenzione Differenziale Locale. Inoltre, una Testa di Contesto Anatomico perfeziona le previsioni patologiche basandosi su attivazioni anatomiche morbide, sfruttando le note relazioni spaziali dei reperti gastrointestinali. Insieme alla Perdita di Separazione Angolare, vengono addestrati prompt di caratteristiche testuali apprendibili e un aumento dei logit basato su prototipi per evitare il collasso dei prototipi penalizzando la similarità coseno fuori diagonale.

Fatti principali

  • Il framework mira al rilevamento di eventi temporali multi-etichetta in VCE.
  • Affronta l'estremo squilibrio di classi nel dataset Galar.
  • Utilizza la Perdita di Separazione Angolare sui prototipi di classe.
  • Impiega un decodificatore temporale a Macchina a Stati Biologici.
  • Il backbone è BiomedCLIP.
  • Il modulo di Attenzione Differenziale Locale fonde tre fotogrammi consecutivi.
  • La Testa di Contesto Anatomico condiziona le previsioni sulle attivazioni anatomiche.
  • Vengono utilizzati prompt di caratteristiche testuali apprendibili e aumento dei logit basato su prototipi.

Entità

Fonti