La Lanterna di Newton: Framework RL per Avviamento a Caldo del Flusso di Potenza CA

other · 2026-05-13

Un nuovo framework di apprendimento per rinforzo, La Lanterna di Newton, mette a punto modelli neurali di avviamento a caldo per il flusso di potenza CA utilizzando l'ottimizzazione delle politiche relative di gruppo e un modello di ricompensa appreso. L'approccio affronta la scarsa generalizzazione dei metodi supervisionati su istanze pesantemente caricate vicine al collasso di tensione. Un limite inferiore teorico sulle iterazioni di Newton-Raphson, dipendente dalla direzione dell'errore piuttosto che dalla sua entità, spiega la modalità di fallimento vicino alle biforcazioni sella-nodo. La Lanterna di Newton utilizza il numero di iterazioni come segnale di supervisione e supera le baseline sui benchmark IEEE 118-bus, GOC 500-bus e GOC 2000-bus.

Fatti principali

La Lanterna di Newton è un framework di apprendimento per rinforzo per mettere a punto modelli di avviamento a caldo del flusso di potenza CA.
Combina l'ottimizzazione delle politiche relative di gruppo con un modello di ricompensa appreso addestrato su perturbazioni delle previsioni del modello base.
Il metodo utilizza il numero di iterazioni come segnale di supervisione.
Un limite inferiore teorico sulle iterazioni di Newton-Raphson dipende dalla direzione dell'errore, non dalla sua entità.
Il limite diventa vacuo quando il più piccolo valore singolare dello Jacobiano del flusso di potenza si riduce.
La regressione supervisionata fallisce vicino alla biforcazione sella-nodo a causa di questo effetto.
La Lanterna di Newton è stata testata sui benchmark IEEE 118-bus, GOC 500-bus e GOC 2000-bus.
È l'unico metodo che raggiunge prestazioni robuste su tutti i benchmark.

Entità

—

Fonti

arXiv cs.AI — 2026-05-13