MOCI: Inferenza di Vincoli Multi-Obiettivo per l'Apprendimento per Rinforzo
Un nuovo framework, Multi-Objective Constraint Inference (MOCI), estrae congiuntamente vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti nell'apprendimento per rinforzo. A differenza degli approcci esistenti che assumono dimostrazioni omogenee da un singolo esperto o da più esperti con obiettivi identici, MOCI modella comportamenti diversi e potenzialmente conflittuali. Le valutazioni empiriche mostrano che MOCI supera significativamente le baseline in termini di prestazioni predittive ed efficienza computazionale.
Fatti principali
- 1. MOCI è un nuovo framework per l'inferenza di vincoli nell'apprendimento per rinforzo.
- 2. Estrae vincoli condivisi e preferenze individuali da traiettorie eterogenee di esperti.
- 3. Gli approcci esistenti assumono dimostrazioni omogenee.
- 4. MOCI gestisce più esperti con obiettivi diversi.
- 5. Le valutazioni empiriche mostrano che MOCI supera le baseline esistenti.
- 6. MOCI raggiunge prestazioni predittive migliorate.
- 7. MOCI mantiene l'efficienza computazionale.
- 8. L'articolo è disponibile su arXiv con ID 2605.06951.
Entità
Istituzioni
- arXiv