Global PSRO: Un Nuovo Algoritmo per il Calcolo dell'Equilibrio in Grandi Giochi a Somma Zero

other · 2026-05-28

I ricercatori propongono Global Policy-Space Response Oracles (Global PSRO), un nuovo algoritmo che migliora il calcolo dell'equilibrio in grandi giochi a somma zero. Il framework PSRO standard espande iterativamente un insieme di strategie ristretto utilizzando l'apprendimento per rinforzo profondo, ma le varianti esistenti spesso si espandono in modo inefficiente basandosi sulle migliori risposte alle meta-strategie calcolate dai payoff del gioco ristretto. Global PSRO introduce un framework di esplorazione-selezione in due fasi che minimizza direttamente la Population Exploitability (PE), una misura di quanto bene l'insieme ristretto rappresenti l'intero gioco. Questo approccio guida l'espansione della popolazione valutando la qualità post-espansione, portando a insiemi di strategie più efficienti sotto budget computazionali limitati. L'articolo è pubblicato su arXiv con ID 2605.28273.

Fatti principali

arXiv:2605.28273v1
Tipo di annuncio: nuovo
Il framework PSRO scala il calcolo dell'equilibrio a grandi giochi a somma zero
PSRO espande iterativamente un insieme di strategie ristretto usando l'apprendimento per rinforzo profondo
Le varianti PSRO esistenti si espandono usando le migliori risposte alle meta-strategie
Global PSRO utilizza la Population Exploitability (PE) per misurare la qualità dell'insieme ristretto
Global PSRO introduce un framework di esplorazione-selezione in due fasi
Global PSRO minimizza esplicitamente la PE durante l'espansione

Global PSRO: Un Nuovo Algoritmo per il Calcolo dell'Equilibrio in Grandi Giochi a Somma Zero

Fatti principali

Entità

Istituzioni

Fonti