ARTFEED — Contemporary Art Intelligence

StratFormer: Modellazione dell'Avversario Basata su Transformer in Giochi a Informazione Imperfetta

ai-technology · 2026-04-30

Un nuovo sistema di intelligenza artificiale chiamato StratFormer utilizza un'architettura transformer per modellare e sfruttare gli avversari in giochi a informazione imperfetta. Sviluppato attraverso un curriculum a due fasi, prima addestra una testa di modellazione dell'avversario per identificare schemi comportamentali mentre segue una politica di gioco teoricamente ottimale (GTO), poi si sposta verso lo sfruttamento della miglior risposta (BR) utilizzando un programma di regolarizzazione per avversario. L'architettura presenta token a doppio turno e caratteristiche di bucket-rate che codificano le tendenze dell'avversario in cinque contesti strategici. Testato su Leduc Hold'em, una piccola variante del poker, contro sei archetipi di avversario a due livelli di forza, lo sfruttabilità variava da 0,15 a 1,26 Big Blinds (BB) per mano.

Fatti principali

  • 1. StratFormer è un meta-agente basato su transformer per la modellazione e lo sfruttamento dell'avversario.
  • 2. Utilizza un curriculum a due fasi: prima politica GTO, poi sfruttamento BR.
  • 3. Token a doppio turno e caratteristiche di bucket-rate codificano le tendenze dell'avversario.
  • 4. Testato su Leduc Hold'em con sei archetipi di avversario a due livelli di forza.
  • 5. Lo sfruttabilità variava da 0,15 a 1,26 BB per mano.

Entità

Fonti