Regressione Simbolica Basata su LLM Migliorata dall'Estensione del Contesto Programmato
Un nuovo framework per la regressione simbolica (SR) sfrutta i modelli linguistici di grandi dimensioni (LLM) con l'estensione del contesto programmato per migliorare la scoperta di espressioni matematiche dai dati. I metodi tradizionali di SR, basati su algoritmi genetici, soffrono di problemi di scalabilità ed espressività. Recenti approcci di ricerca evolutiva basati su LLM mostrano promesse, ma si basano esclusivamente su metriche scalari come l'errore quadratico medio, ignorando le ricche informazioni del dataset. Il metodo proposto consente interazioni basate su codice con il dataset, permettendo un'analisi attiva dei dati e l'estrazione di caratteristiche contestuali per guidare la ricerca. Questo approccio affronta una limitazione chiave degli SR basati su LLM esistenti, incorporando feedback più ricchi oltre ai semplici metriche di errore. Il lavoro è dettagliato nel preprint arXiv 2605.03101.
Fatti principali
- La regressione simbolica scopre espressioni matematiche dai dati
- I metodi tradizionali usano algoritmi genetici con limiti di scalabilità
- La ricerca evolutiva basata su LLM è un approccio recente
- I metodi LLM esistenti si basano solo su metriche scalari come l'errore quadratico medio
- Il nuovo framework aggiunge l'estensione del contesto programmato
- Il metodo consente interazioni basate su codice con il dataset
- Il framework esegue un'analisi attiva dei dati
- Preprint disponibile su arXiv: 2605.03101
Entità
—