ARTFEED — Contemporary Art Intelligence

PrefBench: Benchmark per Agenti LLM nelle Negoziazioni di Prezzi Personalizzati

ai-technology · 2026-05-25

PrefBench è un benchmark che utilizza simulazioni per valutare agenti LLM zero-shot in negoziazioni che coinvolgono prezzi personalizzati con preferenze nascoste. Ogni episodio presenta un acquirente simulato abbinato a un pacchetto di personalizzazione del veicolo specifico. Il venditore ha accesso a descrittori pubblici del profilo, dettagli del pacchetto e la cronologia delle negoziazioni, mentre le variabili latenti dell'acquirente influenzano aspetti come la valutazione, la pazienza, le strategie di controfferta e le decisioni di ritiro. Questo benchmark implementa un protocollo di riepilogo dello stato per LLM che richiede agli agenti di produrre azioni JSON precise all'interno di un quadro definito di informazioni nascoste. Gli autori confrontano venditori LLM zero-shot con benchmark euristici su 7.500 episodi. Lo studio è disponibile su arXiv con l'identificatore 2605.22855.

Fatti principali

  • 1. PrefBench è un benchmark basato su simulatore per negoziazioni di prezzi personalizzati con preferenze nascoste.
  • 2. Ogni episodio abbina un acquirente simulato a un pacchetto di personalizzazione del veicolo fisso.
  • 3. Il venditore osserva descrittori pubblici del profilo, informazioni sul pacchetto e cronologia delle negoziazioni.
  • 4. Le variabili latenti dell'acquirente governano valutazione, pazienza, comportamento di controfferta e decisioni di ritiro.
  • 5. Utilizza un protocollo di riepilogo dello stato per LLM che richiede azioni JSON rigorose.
  • 6. Valuta venditori LLM zero-shot rispetto a riferimenti euristici.
  • 7. Condotto su 7.500 episodi.
  • 8. Articolo disponibile su arXiv con identificatore 2605.22855.

Entità

Istituzioni

  • arXiv

Fonti