FocusDepth: Stima della Profondità Monoculare Consapevole della Regione

other · 2026-05-13

Un nuovo compito chiamato Stima della Profondità Monoculare Focalizzabile (FDE) è stato presentato dai ricercatori, concentrandosi sul miglioramento dell'accuratezza della stima della profondità nelle aree in primo piano, garantendo confini netti e mantenendo una geometria globale coerente per le regioni target designate. L'innovativo framework FocusDepth utilizza prompt di riquadri e testo per guidare la modellazione della profondità, incorporando un modulo di Fusione Allineata Spazialmente Multi-Scala (MSSA) che allinea le caratteristiche del Segment Anything Model 3 con la serie Depth Anything. Questo metodo mira a superare le carenze degli obiettivi uniformi pixel-wise presenti nei modelli di profondità monoculari di base.

Fatti principali

La Stima della Profondità Monoculare Focalizzabile (FDE) è un compito di stima della profondità consapevole della regione.
FocusDepth è un framework di stima della profondità relativa monoculare condizionato da prompt.
La Fusione Allineata Spazialmente Multi-Scala (MSSA) allinea le caratteristiche multi-scala del Segment Anything Model 3 alla famiglia Depth Anything.
Il metodo utilizza prompt di riquadri/testo per specificare le regioni target.
L'approccio dà priorità all'accuratezza della profondità in primo piano, transizioni di confine nette e geometria globale coerente della scena.
L'articolo è pubblicato su arXiv con ID 2605.11756.
La ricerca affronta le limitazioni degli obiettivi uniformi pixel-wise nei modelli di profondità monoculari.

FocusDepth: Stima della Profondità Monoculare Consapevole della Regione

Fatti principali

Entità

Istituzioni

Fonti