ARTFEED — Contemporary Art Intelligence

ONOTE Benchmark mira all'elaborazione omnimodale della notazione musicale

other · 2026-04-24

I ricercatori hanno introdotto ONOTE, un benchmark multi-formato progettato per valutare l'elaborazione omnimodale della notazione (ONP) nei sistemi di IA. L'ONP richiede l'allineamento tra domini uditivi, visivi e simbolici, ma la ricerca attuale è frammentata e orientata verso la notazione occidentale. Le metriche esistenti, incluso 'LLM-as-a-judge', soffrono di allucinazioni e non riescono a valutare il ragionamento strutturale. ONOTE utilizza un pipeline deterministico basato sulla proiezione canonica dell'altezza per eliminare i bias di valutazione soggettivi in diversi sistemi di notazione. La valutazione dei principali modelli omnimodali rivela una discrepanza tra accuratezza percettiva e comprensione teorico-musicale.

Fatti principali

  • ONOTE è un benchmark multi-formato per l'elaborazione omnimodale della notazione.
  • La ricerca attuale sull'ONP è frammentata e orientata verso la notazione occidentale.
  • Le metriche LLM-as-a-judge sono inaffidabili a causa di allucinazioni sistemiche.
  • ONOTE utilizza un pipeline deterministico basato sulla proiezione canonica dell'altezza.
  • Il benchmark elimina i bias di valutazione soggettivi in diversi sistemi di notazione.
  • La valutazione mostra una discrepanza tra accuratezza percettiva e comprensione teorico-musicale.
  • L'articolo è pubblicato su arXiv con ID 2604.20719.
  • L'ONP richiede l'allineamento tra domini uditivi, visivi e simbolici.

Entità

Istituzioni

  • arXiv

Fonti