ARTFEED — Contemporary Art Intelligence

Global PSRO: Un Nuovo Algoritmo per il Calcolo dell'Equilibrio in Grandi Giochi a Somma Zero

other · 2026-05-28

I ricercatori propongono Global Policy-Space Response Oracles (Global PSRO), un nuovo algoritmo che migliora il calcolo dell'equilibrio in grandi giochi a somma zero. Il framework PSRO standard espande iterativamente un insieme di strategie ristretto utilizzando l'apprendimento per rinforzo profondo, ma le varianti esistenti spesso si espandono in modo inefficiente basandosi sulle migliori risposte alle meta-strategie calcolate dai payoff del gioco ristretto. Global PSRO introduce un framework di esplorazione-selezione in due fasi che minimizza direttamente la Population Exploitability (PE), una misura di quanto bene l'insieme ristretto rappresenti l'intero gioco. Questo approccio guida l'espansione della popolazione valutando la qualità post-espansione, portando a insiemi di strategie più efficienti sotto budget computazionali limitati. L'articolo è pubblicato su arXiv con ID 2605.28273.

Fatti principali

  • arXiv:2605.28273v1
  • Tipo di annuncio: nuovo
  • Il framework PSRO scala il calcolo dell'equilibrio a grandi giochi a somma zero
  • PSRO espande iterativamente un insieme di strategie ristretto usando l'apprendimento per rinforzo profondo
  • Le varianti PSRO esistenti si espandono usando le migliori risposte alle meta-strategie
  • Global PSRO utilizza la Population Exploitability (PE) per misurare la qualità dell'insieme ristretto
  • Global PSRO introduce un framework di esplorazione-selezione in due fasi
  • Global PSRO minimizza esplicitamente la PE durante l'espansione

Entità

Istituzioni

  • arXiv

Fonti