Framework HMM-DQN per la strategia energetica di F1 2026 in condizioni di osservabilità parziale

other · 2026-05-18

Un recente articolo su arXiv ha proposto un nuovo sistema a due parti per prendere decisioni sull'uso dell'energia nella stagione di Formula 1 del 2026. Le regole aggiornate richiedono un equilibrio 50/50 tra motori a combustione interna e batterie, consentendo un recupero energetico illimitato e una modalità Override controllata dal pilota. Poiché la gestione ottimale dell'energia dipende dagli stati non osservati delle vetture rivali, questo scenario è classificato come un Gioco Stocastico Parzialmente Osservabile, che non può essere affrontato con metodi standard a singolo agente. La prima parte impiega un Modello di Markov Nascosto a 40 stati per stimare la probabilità dei livelli di carica ERS dei concorrenti e altri fattori dai dati telemetrici. La seconda parte presenta una Deep Q-Network che sfrutta i risultati dell'HMM per elaborare strategie di utilizzo dell'energia, garantendo la praticità del framework.

Fatti principali

1. I regolamenti tecnici di Formula 1 2026 introducono una suddivisione di potenza 50/50 tra ICE e batteria
2. Sono consentiti rigenerazione illimitata e modalità Override controllata dal pilota
3. L'impiego ottimale dell'energia dipende dagli stati nascosti delle vetture rivali
4. Il problema è un Gioco Stocastico Parzialmente Osservabile
5. Primo strato: Modello di Markov Nascosto (HMM) a 40 stati per l'inferenza
6. L'HMM inferisce il livello di carica ERS del rivale (H, M, L_harvest, L_derate), la modalità Override, il degrado degli pneumatici
7. Sei segnali telemetrici pubblicamente osservabili sono utilizzati come input
8. Secondo strato: politica Deep Q-Network (DQN) che utilizza lo stato di credenza dell'HMM

Framework HMM-DQN per la strategia energetica di F1 2026 in condizioni di osservabilità parziale

Fatti principali

Entità

Istituzioni

Fonti