FinCAD: Mitigare il Bias di Look-Ahead nei Backtest Finanziari con LLM

other · 2026-05-26

Un nuovo articolo su arXiv identifica un difetto critico nell'uso di grandi modelli linguistici per il backtesting finanziario: il bias parametrico di look-ahead. Poiché i LLM sono addestrati su dati storici fino a una data di cutoff, essi 'conoscono' di fatto i risultati passati del mercato, rendendo inaffidabili i backtest su periodi precedenti al cutoff. Per affrontare questo problema, gli autori propongono FinCAD, un adattamento in fase di inferenza del Context-Aware Decoding. FinCAD utilizza un pipeline avversario di scoperta dei bias per apprendere un prompt preliminare di attivazione della memoria specifico del modello, combinato con una regola adattiva per entità e data che scala la forza del CAD in base alla memorizzazione per (entità, data). Questo penalizza le date memorizzate in-sample mentre decade a zero out-of-sample. Testato su cinque LLM da 7-14 miliardi di parametri e cinque mega-cap azionarie, FinCAD riduce i rendimenti dei backtest in-sample fino al -67,1% sulle date memorizzate, mantenendo i rendimenti out-of-sample del 2025 entro $8K e lo Sharpe ratio entro 0,10 rispetto al baseline, preservando le capacità general-purpose.

Fatti principali

Il bias parametrico di look-ahead rende inaffidabile il backtesting dei LLM su dati finanziari storici.
FinCAD è un adattamento in fase di inferenza del Context-Aware Decoding.
FinCAD abbina un pipeline avversario di scoperta dei bias a una regola adattiva per entità e data.
Testato su cinque LLM da 7-14 miliardi di parametri e cinque mega-cap azionarie.
FinCAD riduce i rendimenti dei backtest in-sample fino al -67,1% sulle date memorizzate.
I rendimenti out-of-sample del 2025 sono entro $8K rispetto al baseline.
Lo Sharpe ratio out-of-sample è entro 0,10 rispetto al baseline.
Le capacità general-purpose vengono preservate.

FinCAD: Mitigare il Bias di Look-Ahead nei Backtest Finanziari con LLM

Fatti principali

Entità

Istituzioni

Fonti