La semplicità batte la complessità nello srotolamento di fase InSAR vincolato dalla fisica
Una recente indagine pubblicata su arXiv mette in discussione la preferenza prevalente per architetture complesse di visione artificiale nel contesto dello srotolamento di fase InSAR vincolato dalla fisica. Questa ricerca rappresenta il primo ampio studio di ablazione architetturale su un benchmark globale LiCSAR, che include 20 frame, 39.724 patch e un totale di 651 milioni di pixel. I risultati indicano che una U-Net standard con 7,76 milioni di parametri ha superato i modelli basati sull'attenzione, che hanno 11,37 milioni di parametri, raggiungendo un R² di 0,834 e un RMSE di 1,01 cm, mostrando miglioramenti del 34% in R² e del 51% in RMSE. Inoltre, l'analisi della densità spettrale di potenza ha mostrato che i meccanismi di attenzione introducono artefatti ad alta frequenza non fisici, violando i vincoli di levigatezza essenziali per i campi geofisici. Questa ricerca evidenzia la potenziale efficacia di modelli più semplici per lo srotolamento di fase operativo nel monitoraggio dell'attività vulcanica e sismica.
Fatti principali
- Primo ampio studio di ablazione architetturale su benchmark LiCSAR
- Il benchmark include 20 frame, 39.724 patch, 651M pixel
- U-Net vanilla (7,76M parametri) raggiunge R²=0,834, RMSE=1,01 cm
- I modelli basati sull'attenzione (11,37M parametri) hanno prestazioni inferiori del 34% in R² e del 51% in RMSE
- L'analisi PSD mostra che l'attenzione introduce artefatti ad alta frequenza non fisici (>0,3 cicli/pixel)
- Lo studio sfida la tendenza del settore verso architetture ad alta complessità
- Focus sulla regressione geofisica vincolata dalla fisica per InSAR
- Lo srotolamento di fase operativo è un collo di bottiglia chiave nel monitoraggio vulcanico e sismico
Entità
Istituzioni
- arXiv
- LiCSAR