ARTFEED — Contemporary Art Intelligence

ValueAlpha: Stress-Test dei Giudici LLM per le Motivazioni di Investimento

ai-technology · 2026-04-30

Un nuovo articolo introduce ValueAlpha, un protocollo di stress-test preregistrato con gate di accordo per valutare le motivazioni di investimento giudicate da LLM prima che i rendimenti siano osservabili. Il protocollo affronta il problema della valutazione pre-realizzazione nelle decisioni di investimento a lungo termine, dove i rendimenti realizzati arrivano troppo tardi e sono troppo rumorosi. ValueAlpha utilizza un gate di accordo per decidere quando le affermazioni giudicate da LLM sono pubblicabili, qualificate o non valide. In un prototipo controllato con 1.000 cicli decisionali onesti e 100 controlli avversari (1.100 traiettorie, 5.500 chiamate al giudice), il gate di accordo aggregato si è attestato a κ̄_w = 0,7168, ma diverse sovra-affermazioni sono state prevenute. I sistemi di rango inferiore sono collassati. L'articolo è disponibile su arXiv.

Fatti principali

  • ValueAlpha è un protocollo di stress-test preregistrato con gate di accordo.
  • Valuta le motivazioni di investimento giudicate da LLM prima che i rendimenti siano osservabili.
  • Il protocollo affronta il problema della valutazione pre-realizzazione.
  • In un prototipo controllato sono stati utilizzati 1.000 cicli decisionali onesti e 100 controlli avversari.
  • Il gate di accordo aggregato si è attestato a κ̄_w = 0,7168.
  • Diverse sovra-affermazioni sono state prevenute.
  • I sistemi di rango inferiore sono collassati.
  • L'articolo è disponibile su arXiv.

Entità

Istituzioni

  • arXiv

Fonti