ARTFEED — Contemporary Art Intelligence

QYOLO: Rilevamento di Oggetti Leggero Ispirato ai Quanti

ai-technology · 2026-04-30

Un nuovo framework di rilevamento oggetti chiamato QYOLO raggiunge una compressione architetturale sostituendo i moduli C2f bottleneck più profondi con un QMixBlock ispirato ai quanti. Il metodo utilizza un mixing sinusoidale con parametri condivisi tra gli stadi backbone P4/16 (512 canali) e P5/32 (1024 canali), riducendo i parametri pur mantenendo le prestazioni. Il collo e la testa di rilevamento rimangono classici.

Fatti principali

  • QYOLO è un framework di mixing di canali ispirato ai quanti per il rilevamento oggetti.
  • Sostituisce i due moduli C2f bottleneck più profondi a P4/16 e P5/32 con un QMixBlock.
  • Il QMixBlock utilizza un mixing sinusoidale con parametri apprendibili condivisi tra gli stadi.
  • Il collo e la testa di rilevamento sono completamente classici e invariati.
  • L'approccio riduce il carico computazionale derivante dalla scalabilità quadratica con la larghezza dei canali.
  • L'articolo è disponibile su arXiv con ID 2604.26435.
  • Mira al rilevamento oggetti leggero per la percezione visiva in tempo reale.
  • I rilevatori a stadio singolo sono la soluzione dominante per la percezione in tempo reale.

Entità

Istituzioni

  • arXiv

Fonti