DART: Modello Visione-Linguaggio per il Monitoraggio delle Condizioni delle Corde
Un nuovo modello di base per l'IA, chiamato DART (Damage Assessment via Rope Transformer), è stato creato per monitorare a fondo le condizioni delle funi in fibra sintetica (SFR) utilizzate in applicazioni offshore, marittime e industriali. A differenza dei classificatori convenzionali, DART offre valutazioni continue della gravità, suggerimenti di manutenzione, avvisi di anomalie, previsioni di deterioramento e report automatizzati basati su una singola immagine di ispezione. Questo modello migliora l'architettura Joint-Embedding Predictive Architecture (JEPA) integrando un Vision Transformer (ViT-H/14) con Llama-3.2-3B-Instruct attraverso un modulo di Fusione Cross-Modale Condizionata dalla Gravità (SC-CMF). Le innovazioni chiave includono HD-MASK, una tecnica di mascheramento guidato dalla salienza; porte di gravità apprendibili per ogni classe; e un'architettura multi-task coesa. I risultati sono disponibili su arXiv con l'identificatore 2605.04943.
Fatti principali
- 1. DART sta per Damage Assessment via Rope Transformer
- 2. Il modello affronta l'intero flusso di lavoro di ispezione delle funi
- 3. Utilizza Vision Transformer (ViT-H/14) e Llama-3.2-3B-Instruct
- 4. Include un modulo di Fusione Cross-Modale Condizionata dalla Gravità (SC-CMF)
- 5. HD-MASK è una strategia di mascheramento guidato dalla salienza
- 6. Fornisce stime di gravità, raccomandazioni di manutenzione, segnalazioni di anomalie, timeline di deterioramento e report automatizzati
- 7. Pubblicato su arXiv con ID 2605.04943
- 8. Progettato per funi in fibra sintetica (SFR) in contesti offshore, marittimi e industriali
Entità
Istituzioni
- arXiv