Quadro di Apprendimento Ispirato alla Fisica per Sistemi Port-Hamiltoniani
Un nuovo quadro di apprendimento ispirato alla fisica sviluppa simultaneamente modelli di sistemi port-Hamiltoniani (pH) e controllori passivi basati sul bilanciamento energetico (EB-PBC) utilizzando dati di traiettoria. Questo metodo prevede il miglioramento iterativo del modello di sistema basato sui dati raccolti sotto la politica di controllo esistente e la successiva riottimizzazione del controllore secondo il modello rivisto. Entrambi gli elementi sono rappresentati da reti neurali che incorporano la dinamica pH e il quadro EB-PBC, fornendo chiarezza riguardo alle interazioni energetiche. Il controllore risultante garantisce che il sistema a ciclo chiuso rimanga intrinsecamente passivo e dimostrabilmente stabile, sfruttando le dinamiche passive dell'impianto senza annullare il potenziale naturale. Inoltre, una tecnica di regolarizzazione della dissipazione promuove un rigoroso decadimento energetico durante l'addestramento, rafforzando la resilienza contro le discrepanze sim-to-real.
Fatti principali
- Il quadro co-apprende modelli di sistemi pH e controllori EB-PBC da dati di traiettoria.
- Viene utilizzata un'ottimizzazione alternata con raccolta dati consapevole della politica.
- Reti neurali parametrizzano sia il modello che il controllore, incorporando la dinamica pH e la struttura EB-PBC.
- Il controllore appreso garantisce passività a ciclo chiuso e stabilità dimostrabile.
- Il controllore sfrutta le dinamiche passive dell'impianto senza annullare il potenziale naturale.
- La regolarizzazione della dissipazione impone un rigoroso decadimento energetico durante l'addestramento.
- L'approccio migliora la robustezza rispetto ai divari sim-to-real.
- Pubblicato su arXiv con ID 2604.26172.
Entità
—