DAGS: Avvii di Gioco Potenziati dai Dati Accelerano l'Apprendimento Autonomo in Giochi a Informazione Imperfetta

other · 2026-05-16

Una nuova strategia per avviare il campionamento multi-agente, nota come Avvii di Gioco Potenziati dai Dati (DAGS), mira a migliorare l'esplorazione online all'interno di metodi di policy-gradient regolarizzati per giochi a somma zero a due giocatori. Questa tecnica sfrutta dimostrazioni offline di giocatori umani esperti per avviare la raccolta di dati di apprendimento per rinforzo in stati intermedi chiave, promuovendo così l'esplorazione di sottogiochi strategicamente importanti. Gli esperimenti sono stati condotti utilizzando dataset sintetici e varianti di controllo analiticamente gestibili a lungo orizzonte. Questa ricerca affronta le sfide computazionali incontrate nei giochi competitivi su larga scala a informazione imperfetta come StarCraft, Dota e CounterStrike, ostacolati da ricompense sparse e difficile esplorazione a lungo orizzonte. L'articolo è disponibile su arXiv con ID 2605.14379.

Fatti principali

1. DAGS sta per Avvii di Gioco Potenziati dai Dati.
2. Si rivolge a giochi a somma zero a due giocatori (2p0s).
3. Vengono utilizzate dimostrazioni offline di giocatori umani esperti per campionare stati intermedi.
4. Il metodo accelera l'esplorazione online nei metodi di policy-gradient regolarizzati.
5. Gli esperimenti hanno utilizzato dataset sintetici e varianti di controllo a lungo orizzonte.
6. L'articolo è su arXiv: 2605.14379.
7. Giochi menzionati: StarCraft, Dota, CounterStrike.
8. L'approccio affronta le sfide delle ricompense sparse e dell'esplorazione a lungo orizzonte.

DAGS: Avvii di Gioco Potenziati dai Dati Accelerano l'Apprendimento Autonomo in Giochi a Informazione Imperfetta

Fatti principali

Entità

Istituzioni

Fonti