OP-Mix: Un algoritmo unificato di miscelazione dei dati per l'addestramento di LLM

ai-technology · 2026-05-18

Un nuovo algoritmo di miscelazione dei dati chiamato OP-Mix (On-Policy Mix) è stato introdotto dai ricercatori, progettato per funzionare durante l'intero ciclo di vita dell'addestramento dei modelli linguistici. Questo approccio supera le limitazioni dei metodi attuali, che sono limitati a fasi specifiche come il pre-addestramento o l'apprendimento continuo. Inquadrando la miscelazione dei dati come una sfida decisionale online, OP-Mix utilizza adattatori a basso rango per replicare efficientemente miscele potenziali. L'articolo di ricerca è disponibile su arXiv con l'identificatore 2605.15220.

Fatti principali

OP-Mix è un algoritmo di miscelazione dei dati per l'addestramento di modelli linguistici
Funziona nelle fasi di pre-addestramento, apprendimento continuo e adattamento
I metodi esistenti affrontano solo una fase alla volta
L'approccio tratta la miscelazione dei dati come un problema decisionale online
Le miscele candidate sono simulate interpolando adattatori a basso rango
L'articolo è pubblicato su arXiv con ID 2605.15220
Il titolo è 'Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time'

OP-Mix: Un algoritmo unificato di miscelazione dei dati per l'addestramento di LLM

Fatti principali

Entità

Istituzioni

Fonti