La Perdita di Entropia delle Cifre Migliora la Predizione Numerica nei LLM

ai-technology · 2026-05-22

Viene proposto un nuovo metodo chiamato Digit Entropy Loss (DEL) per migliorare l'apprendimento numerico nei modelli linguistici di grandi dimensioni (LLM). La predizione dei numeri è cruciale per la risoluzione di problemi matematici e la generazione di codice, ma la stima di massima verosimiglianza standard (MLE) non è adatta ai numeri. Gli approcci esistenti basati su penalità, come Number Token Loss e Discretized Distance Loss, introducono un bias induttivo ma causano distribuzioni delle cifre troppo appuntite o troppo appiattite. DEL riformula l'ottimizzazione dell'entropia non supervisionata con tre progetti chiave, sfruttando le informazioni a livello di cifra per migliorare l'apprendimento numerico auto-regressivo. L'articolo fornisce un'analisi approfondita dell'apprendimento numerico nei LLM, mostrando che i metodi attuali seguono una formulazione criterio-distanza. DEL mira a bilanciare l'ottimizzazione e i priori geometrici per una migliore predizione dei numeri.

Fatti principali

DEL sta per Digit Entropy Loss
L'articolo è su arXiv con ID 2605.20369
La predizione dei numeri è fondamentale per i LLM in matematica e codice
MLE non è adatta per la predizione dei numeri
Number Token Loss e Discretized Distance Loss sono metodi esistenti
I metodi esistenti causano distribuzioni delle cifre troppo appuntite o troppo appiattite
DEL riformula l'ottimizzazione dell'entropia non supervisionata
DEL utilizza tre progetti chiave per l'apprendimento auto-regressivo

La Perdita di Entropia delle Cifre Migliora la Predizione Numerica nei LLM

Fatti principali

Entità

Istituzioni

Fonti