Regressione Simbolica Basata su LLM Migliorata dall'Estensione del Contesto Programmato

ai-technology · 2026-05-07

Un nuovo framework per la regressione simbolica (SR) sfrutta i modelli linguistici di grandi dimensioni (LLM) con l'estensione del contesto programmato per migliorare la scoperta di espressioni matematiche dai dati. I metodi tradizionali di SR, basati su algoritmi genetici, soffrono di problemi di scalabilità ed espressività. Recenti approcci di ricerca evolutiva basati su LLM mostrano promesse, ma si basano esclusivamente su metriche scalari come l'errore quadratico medio, ignorando le ricche informazioni del dataset. Il metodo proposto consente interazioni basate su codice con il dataset, permettendo un'analisi attiva dei dati e l'estrazione di caratteristiche contestuali per guidare la ricerca. Questo approccio affronta una limitazione chiave degli SR basati su LLM esistenti, incorporando feedback più ricchi oltre ai semplici metriche di errore. Il lavoro è dettagliato nel preprint arXiv 2605.03101.

Fatti principali

La regressione simbolica scopre espressioni matematiche dai dati
I metodi tradizionali usano algoritmi genetici con limiti di scalabilità
La ricerca evolutiva basata su LLM è un approccio recente
I metodi LLM esistenti si basano solo su metriche scalari come l'errore quadratico medio
Il nuovo framework aggiunge l'estensione del contesto programmato
Il metodo consente interazioni basate su codice con il dataset
Il framework esegue un'analisi attiva dei dati
Preprint disponibile su arXiv: 2605.03101

Entità

—

Fonti

arXiv cs.AI — 2026-05-06