Framework HMM-DQN per la strategia energetica di F1 2026 in condizioni di osservabilità parziale
Un recente articolo su arXiv ha proposto un nuovo sistema a due parti per prendere decisioni sull'uso dell'energia nella stagione di Formula 1 del 2026. Le regole aggiornate richiedono un equilibrio 50/50 tra motori a combustione interna e batterie, consentendo un recupero energetico illimitato e una modalità Override controllata dal pilota. Poiché la gestione ottimale dell'energia dipende dagli stati non osservati delle vetture rivali, questo scenario è classificato come un Gioco Stocastico Parzialmente Osservabile, che non può essere affrontato con metodi standard a singolo agente. La prima parte impiega un Modello di Markov Nascosto a 40 stati per stimare la probabilità dei livelli di carica ERS dei concorrenti e altri fattori dai dati telemetrici. La seconda parte presenta una Deep Q-Network che sfrutta i risultati dell'HMM per elaborare strategie di utilizzo dell'energia, garantendo la praticità del framework.
Fatti principali
- 1. I regolamenti tecnici di Formula 1 2026 introducono una suddivisione di potenza 50/50 tra ICE e batteria
- 2. Sono consentiti rigenerazione illimitata e modalità Override controllata dal pilota
- 3. L'impiego ottimale dell'energia dipende dagli stati nascosti delle vetture rivali
- 4. Il problema è un Gioco Stocastico Parzialmente Osservabile
- 5. Primo strato: Modello di Markov Nascosto (HMM) a 40 stati per l'inferenza
- 6. L'HMM inferisce il livello di carica ERS del rivale (H, M, L_harvest, L_derate), la modalità Override, il degrado degli pneumatici
- 7. Sei segnali telemetrici pubblicamente osservabili sono utilizzati come input
- 8. Secondo strato: politica Deep Q-Network (DQN) che utilizza lo stato di credenza dell'HMM
Entità
Istituzioni
- arXiv