ARTFEED — Contemporary Art Intelligence

Il framework AsymmetryZero operazionalizza le preferenze degli esperti come valutazioni semantiche

other · 2026-05-07

Il framework AsymmetryZero, descritto nell'articolo arXiv 2605.04083, affronta il problema di integrare preferenze soggettive, procedurali e specifiche del dominio da parte di esperti umani nei sistemi di valutazione dell'apprendimento per rinforzo. Ogni compito è inquadrato come un contratto di valutazione stabile che chiarisce i criteri di valutazione, dettagliando quali aspetti vengono valutati, il processo di giudizio per ciascun criterio e come vengono determinati i risultati. Questo contratto può essere utilizzato con Inspect per valutazioni solo modello o con il Harbor Framework per valutazioni di agenti, facilitando punteggi comparabili e artefatti di audit condivisi in entrambi i contesti. L'enfasi di questa ricerca è sulla progettazione della valutazione nell'apprendimento per rinforzo, in particolare per compiti del mondo reale con requisiti complessi che sono difficili da codificare come obiettivi precisi o preferenze aperte.

Fatti principali

  • AsymmetryZero è un framework per operazionalizzare le preferenze degli esperti umani come valutazioni semantiche.
  • Rappresenta ogni compito come un contratto di valutazione stabile.
  • Il contratto specifica i criteri di valutazione, i metodi di giudizio e l'aggregazione in un risultato del compito.
  • Può essere eseguito utilizzando Inspect per valutazioni solo modello.
  • Può anche essere eseguito utilizzando il Harbor Framework per valutazioni agentiche.
  • Il framework consente punteggi comparabili e artefatti di audit condivisi in entrambi gli ambienti.
  • Il lavoro è pubblicato su arXiv con identificatore 2605.04083.
  • Affronta le sfide nella progettazione della valutazione RL per compiti soggettivi e specifici del dominio.

Entità

Istituzioni

  • arXiv

Fonti