Diffusioni a Ponte Analitiche per la Generazione di Percorsi Controllati
Il metodo LQ-GM-PID è un approccio innovativo nelle tecniche di bridge-diffusion che consente il trasporto in tempo finito con soluzioni chiare per punteggi, marginali intermedi e gradienti di protocollo, eliminando la necessità di reti neurali o simulazioni stocastiche interne. Trasforma il classico modello di controllo stocastico lineare-quadratico-gaussiano (LQG) in un problema di trasporto di diffusione integrale di percorso (PID). In questo quadro, la dinamica lineare combinata con rumore gaussiano e costi quadratici porta alle equazioni di Riccati, consentendo un feedback ottimale in forma chiusa, dove l'attenzione si sposta dalla regolazione degli stati terminali al raggiungimento di una distribuzione terminale specificata. Sebbene presenti alcune limitazioni, offre una versatilità sufficiente per produrre percorsi controllati.
Fatti principali
- Il metodo si chiama LQ-GM-PID.
- È un metodo di bridge-diffusion per il trasporto in tempo finito.
- Punteggi, marginali intermedi e gradienti di protocollo sono disponibili in forma chiusa.
- Non sono necessarie reti neurali nel ciclo di ottimizzazione.
- Non sono richiesti cicli interni di simulazione stocastica.
- Riformula il controllo stocastico LQG come un problema di trasporto PID.
- Si assumono dinamica lineare, rumore gaussiano e costi quadratici.
- La regolazione dello stato terminale è sostituita da una distribuzione terminale prescritta.
Entità
—