FPILOT: Ottimizzazione a Tempo di Inferenza per Agenti di Trading RL
Un nuovo framework chiamato FPILOT (Financial Plugin Inference-time Learning for Optimal Trading) migliora gli agenti di apprendimento per rinforzo per la gestione del portafoglio consentendo l'ottimizzazione a tempo di inferenza utilizzando previsioni di prezzo. Ispirato al Controllo Predittivo del Modello, FPILOT utilizza un modello predittivo per generare traiettorie di prezzo multi-step senza richiedere rollout iterativi condizionati dall'azione. Ad ogni passo decisionale, il framework ottimizza la politica basandosi su un obiettivo di rendimento immaginato derivato dai prezzi previsti, quindi esegue un passo di trading. È compatibile con qualsiasi agente pre-addestrato e si adatta a previsioni mutevoli.
Fatti principali
- FPILOT sta per Financial Plugin Inference-time Learning for Optimal Trading
- È un framework di ottimizzazione a tempo di inferenza plugin
- Ispirato al Controllo Predittivo del Modello (MPC)
- Utilizza un modello predittivo per traiettorie di prezzo multi-step
- Ottimizza la politica a tempo di inferenza prima di ogni passo di trading
- Compatibile con qualsiasi agente pre-addestrato
- Adatta la politica ai prezzi previsti
- Non richiede rollout iterativi condizionati dall'azione
Entità
—