Reti Quantiliche Implicite Robuste Basate su Quantili per l'Apprendimento per Rinforzo Distribuzionale
Un nuovo articolo su arXiv propone le Reti Quantiliche Implicite Robuste Basate su Quantili (RQIQN), un metodo per migliorare l'apprendimento per rinforzo distribuzionale. L'approccio affronta le distorsioni nelle stime della distribuzione dei rendimenti basate sui quantili applicando l'ottimizzazione robusta distribuzionale di Wasserstein a ciascun slot quantilico. Ciò produce una correzione in forma chiusa al target di Bellman che preserva la media neutrale al rischio impedendo il collasso distribuzionale. Il lavoro è puramente teorico e algoritmico, senza applicazione diretta all'arte o alla cultura.
Fatti principali
- arXiv:2605.08182v1
- Tipo di annuncio: cross
- Propone le Reti Quantiliche Implicite Robuste Basate su Quantili (RQIQN)
- Utilizza il potenziamento robusto distribuzionale di Wasserstein
- Reinterpreta la perdita IQN come problemi locali di stima empirica dei quantili
- Deriva una correzione dipendente dalla frazione al target di Bellman
- La correzione preserva la media quantilica neutrale al rischio
- La correzione impedisce il collasso distribuzionale
Entità
Istituzioni
- arXiv