Nuovi Metodi di Comunicazione Semantica delle Immagini MMSD e SAMR Riducano i Costi di Trasmissione per il Monitoraggio del Traffico
Due nuove pipeline di comunicazione semantica delle immagini, MMSD e SAMR, sono state sviluppate per affrontare i vincoli di comunicazione stringenti nei sistemi di monitoraggio visivo. Questi metodi riducono significativamente i costi di trasmissione preservando al contempo le informazioni visive significative per le applicazioni di monitoraggio del traffico. MMSD (Multi-Modal Semantic Decomposition) raggiunge una compressione molto elevata insieme alla riservatezza dei dati non trasmettendo contenuti pixel sensibili. Invece, sostituisce le immagini originali con rappresentazioni semantiche compatte che includono mappe di segmentazione, mappe dei bordi e descrizioni testuali. La ricostruzione della scena sul lato ricevente utilizza un modello generativo basato su diffusione. SAMR (Semantic-Aware Masking Reconstruction) privilegia una qualità visiva superiore mantenendo al contempo una sostanziale riduzione della larghezza di banda. Entrambi gli approcci riconoscono che i dati visivi nei contesti di monitoraggio sono tipicamente utilizzati per il rilevamento della presenza di oggetti, l'analisi delle relazioni spaziali e la comprensione del contesto della scena piuttosto che per la fedeltà pixel esatta. La ricerca affronta le limitazioni pratiche della trasmissione di immagini a piena risoluzione in ambienti di comunicazione vincolati. Questi metodi di comunicazione semantica rappresentano un progresso nella trasmissione efficiente dei dati visivi per le applicazioni di monitoraggio. L'articolo che descrive queste pipeline è disponibile come arXiv:2604.12622v1 con tipo di annuncio cross.
Fatti principali
- Due pipeline di comunicazione semantica delle immagini sviluppate: MMSD e SAMR
- Progettate per applicazioni di monitoraggio del traffico con vincoli di comunicazione
- MMSD raggiunge un'elevata compressione con riservatezza dei dati
- MMSD sostituisce le immagini con mappe di segmentazione, mappe dei bordi e descrizioni testuali
- MMSD utilizza un modello generativo basato su diffusione per la ricostruzione
- SAMR mira a una qualità visiva superiore con riduzione della larghezza di banda
- I metodi preservano la presenza di oggetti, le relazioni spaziali e il contesto della scena
- Articolo disponibile come arXiv:2604.12622v1 con tipo di annuncio cross
Entità
—