ONOTE Benchmark mira all'elaborazione omnimodale della notazione musicale
I ricercatori hanno introdotto ONOTE, un benchmark multi-formato progettato per valutare l'elaborazione omnimodale della notazione (ONP) nei sistemi di IA. L'ONP richiede l'allineamento tra domini uditivi, visivi e simbolici, ma la ricerca attuale è frammentata e orientata verso la notazione occidentale. Le metriche esistenti, incluso 'LLM-as-a-judge', soffrono di allucinazioni e non riescono a valutare il ragionamento strutturale. ONOTE utilizza un pipeline deterministico basato sulla proiezione canonica dell'altezza per eliminare i bias di valutazione soggettivi in diversi sistemi di notazione. La valutazione dei principali modelli omnimodali rivela una discrepanza tra accuratezza percettiva e comprensione teorico-musicale.
Fatti principali
- ONOTE è un benchmark multi-formato per l'elaborazione omnimodale della notazione.
- La ricerca attuale sull'ONP è frammentata e orientata verso la notazione occidentale.
- Le metriche LLM-as-a-judge sono inaffidabili a causa di allucinazioni sistemiche.
- ONOTE utilizza un pipeline deterministico basato sulla proiezione canonica dell'altezza.
- Il benchmark elimina i bias di valutazione soggettivi in diversi sistemi di notazione.
- La valutazione mostra una discrepanza tra accuratezza percettiva e comprensione teorico-musicale.
- L'articolo è pubblicato su arXiv con ID 2604.20719.
- L'ONP richiede l'allineamento tra domini uditivi, visivi e simbolici.
Entità
Istituzioni
- arXiv