QYOLO: Rilevamento di Oggetti Leggero Ispirato ai Quanti
Un nuovo framework di rilevamento oggetti chiamato QYOLO raggiunge una compressione architetturale sostituendo i moduli C2f bottleneck più profondi con un QMixBlock ispirato ai quanti. Il metodo utilizza un mixing sinusoidale con parametri condivisi tra gli stadi backbone P4/16 (512 canali) e P5/32 (1024 canali), riducendo i parametri pur mantenendo le prestazioni. Il collo e la testa di rilevamento rimangono classici.
Fatti principali
- QYOLO è un framework di mixing di canali ispirato ai quanti per il rilevamento oggetti.
- Sostituisce i due moduli C2f bottleneck più profondi a P4/16 e P5/32 con un QMixBlock.
- Il QMixBlock utilizza un mixing sinusoidale con parametri apprendibili condivisi tra gli stadi.
- Il collo e la testa di rilevamento sono completamente classici e invariati.
- L'approccio riduce il carico computazionale derivante dalla scalabilità quadratica con la larghezza dei canali.
- L'articolo è disponibile su arXiv con ID 2604.26435.
- Mira al rilevamento oggetti leggero per la percezione visiva in tempo reale.
- I rilevatori a stadio singolo sono la soluzione dominante per la percezione in tempo reale.
Entità
Istituzioni
- arXiv