La Lanterna di Newton: Framework RL per Avviamento a Caldo del Flusso di Potenza CA
Un nuovo framework di apprendimento per rinforzo, La Lanterna di Newton, mette a punto modelli neurali di avviamento a caldo per il flusso di potenza CA utilizzando l'ottimizzazione delle politiche relative di gruppo e un modello di ricompensa appreso. L'approccio affronta la scarsa generalizzazione dei metodi supervisionati su istanze pesantemente caricate vicine al collasso di tensione. Un limite inferiore teorico sulle iterazioni di Newton-Raphson, dipendente dalla direzione dell'errore piuttosto che dalla sua entità, spiega la modalità di fallimento vicino alle biforcazioni sella-nodo. La Lanterna di Newton utilizza il numero di iterazioni come segnale di supervisione e supera le baseline sui benchmark IEEE 118-bus, GOC 500-bus e GOC 2000-bus.
Fatti principali
- La Lanterna di Newton è un framework di apprendimento per rinforzo per mettere a punto modelli di avviamento a caldo del flusso di potenza CA.
- Combina l'ottimizzazione delle politiche relative di gruppo con un modello di ricompensa appreso addestrato su perturbazioni delle previsioni del modello base.
- Il metodo utilizza il numero di iterazioni come segnale di supervisione.
- Un limite inferiore teorico sulle iterazioni di Newton-Raphson dipende dalla direzione dell'errore, non dalla sua entità.
- Il limite diventa vacuo quando il più piccolo valore singolare dello Jacobiano del flusso di potenza si riduce.
- La regressione supervisionata fallisce vicino alla biforcazione sella-nodo a causa di questo effetto.
- La Lanterna di Newton è stata testata sui benchmark IEEE 118-bus, GOC 500-bus e GOC 2000-bus.
- È l'unico metodo che raggiunge prestazioni robuste su tutti i benchmark.
Entità
—