FocusDepth: Stima della Profondità Monoculare Consapevole della Regione
Un nuovo compito chiamato Stima della Profondità Monoculare Focalizzabile (FDE) è stato presentato dai ricercatori, concentrandosi sul miglioramento dell'accuratezza della stima della profondità nelle aree in primo piano, garantendo confini netti e mantenendo una geometria globale coerente per le regioni target designate. L'innovativo framework FocusDepth utilizza prompt di riquadri e testo per guidare la modellazione della profondità, incorporando un modulo di Fusione Allineata Spazialmente Multi-Scala (MSSA) che allinea le caratteristiche del Segment Anything Model 3 con la serie Depth Anything. Questo metodo mira a superare le carenze degli obiettivi uniformi pixel-wise presenti nei modelli di profondità monoculari di base.
Fatti principali
- La Stima della Profondità Monoculare Focalizzabile (FDE) è un compito di stima della profondità consapevole della regione.
- FocusDepth è un framework di stima della profondità relativa monoculare condizionato da prompt.
- La Fusione Allineata Spazialmente Multi-Scala (MSSA) allinea le caratteristiche multi-scala del Segment Anything Model 3 alla famiglia Depth Anything.
- Il metodo utilizza prompt di riquadri/testo per specificare le regioni target.
- L'approccio dà priorità all'accuratezza della profondità in primo piano, transizioni di confine nette e geometria globale coerente della scena.
- L'articolo è pubblicato su arXiv con ID 2605.11756.
- La ricerca affronta le limitazioni degli obiettivi uniformi pixel-wise nei modelli di profondità monoculari.
Entità
Istituzioni
- arXiv