FinCAD: Mitigare il Bias di Look-Ahead nei Backtest Finanziari con LLM
Un nuovo articolo su arXiv identifica un difetto critico nell'uso di grandi modelli linguistici per il backtesting finanziario: il bias parametrico di look-ahead. Poiché i LLM sono addestrati su dati storici fino a una data di cutoff, essi 'conoscono' di fatto i risultati passati del mercato, rendendo inaffidabili i backtest su periodi precedenti al cutoff. Per affrontare questo problema, gli autori propongono FinCAD, un adattamento in fase di inferenza del Context-Aware Decoding. FinCAD utilizza un pipeline avversario di scoperta dei bias per apprendere un prompt preliminare di attivazione della memoria specifico del modello, combinato con una regola adattiva per entità e data che scala la forza del CAD in base alla memorizzazione per (entità, data). Questo penalizza le date memorizzate in-sample mentre decade a zero out-of-sample. Testato su cinque LLM da 7-14 miliardi di parametri e cinque mega-cap azionarie, FinCAD riduce i rendimenti dei backtest in-sample fino al -67,1% sulle date memorizzate, mantenendo i rendimenti out-of-sample del 2025 entro $8K e lo Sharpe ratio entro 0,10 rispetto al baseline, preservando le capacità general-purpose.
Fatti principali
- Il bias parametrico di look-ahead rende inaffidabile il backtesting dei LLM su dati finanziari storici.
- FinCAD è un adattamento in fase di inferenza del Context-Aware Decoding.
- FinCAD abbina un pipeline avversario di scoperta dei bias a una regola adattiva per entità e data.
- Testato su cinque LLM da 7-14 miliardi di parametri e cinque mega-cap azionarie.
- FinCAD riduce i rendimenti dei backtest in-sample fino al -67,1% sulle date memorizzate.
- I rendimenti out-of-sample del 2025 sono entro $8K rispetto al baseline.
- Lo Sharpe ratio out-of-sample è entro 0,10 rispetto al baseline.
- Le capacità general-purpose vengono preservate.
Entità
Istituzioni
- arXiv