Nuovo Metodo di Rilevamento Oggetti 3D Migliora le Prestazioni sul Dataset ScanNetv2
Un innovativo meccanismo di Attenzione Multi-Scala è stato integrato nel framework 3DETR, migliorando significativamente il rilevamento di oggetti 3D all'interno di dataset di nuvole di punti. Questo metodo presenta un processo di upsampling che produce mappe di caratteristiche ad alta risoluzione, migliorando l'identificazione di oggetti più piccoli e semanticamente collegati. I test sul dataset ScanNetv2 indicano che il modello 3DETR + MSA supera le tecniche baseline, ottenendo un aumento di quasi l'1% in mAP@25 e un incremento del 4,78% in mAP@50. Sebbene l'applicazione di MSA alla variante 3DETR-m produca miglioramenti minimi, i risultati sottolineano la necessità di adattare le tecniche di upsampling per modelli leggeri. Questo studio affronta le difficoltà associate ai dati sparsi e all'assenza di struttura globale nelle nuvole di punti, dimostrando il valore dell'integrazione dell'estrazione gerarchica delle caratteristiche con meccanismi di attenzione per un rilevamento 3D superiore.
Fatti principali
- Nuovo meccanismo di Attenzione Multi-Scala integrato nell'architettura 3DETR
- Operazione di upsampling genera mappe di caratteristiche ad alta risoluzione
- Migliora il rilevamento di oggetti più piccoli e semanticamente correlati
- Esperimenti condotti sul dataset ScanNetv2
- Ottiene un guadagno di quasi l'1% in mAP@25 rispetto alla baseline
- Ottiene un guadagno del 4,78% in mAP@50 rispetto alla baseline
- Miglioramento limitato quando applicato alla variante 3DETR-m
- Evidenzia l'importanza di adattare la strategia di upsampling per modelli leggeri
Entità
—