ARTFEED — Contemporary Art Intelligence

OP-Mix: Un algoritmo unificato di miscelazione dei dati per l'addestramento di LLM

ai-technology · 2026-05-18

Un nuovo algoritmo di miscelazione dei dati chiamato OP-Mix (On-Policy Mix) è stato introdotto dai ricercatori, progettato per funzionare durante l'intero ciclo di vita dell'addestramento dei modelli linguistici. Questo approccio supera le limitazioni dei metodi attuali, che sono limitati a fasi specifiche come il pre-addestramento o l'apprendimento continuo. Inquadrando la miscelazione dei dati come una sfida decisionale online, OP-Mix utilizza adattatori a basso rango per replicare efficientemente miscele potenziali. L'articolo di ricerca è disponibile su arXiv con l'identificatore 2605.15220.

Fatti principali

  • OP-Mix è un algoritmo di miscelazione dei dati per l'addestramento di modelli linguistici
  • Funziona nelle fasi di pre-addestramento, apprendimento continuo e adattamento
  • I metodi esistenti affrontano solo una fase alla volta
  • L'approccio tratta la miscelazione dei dati come un problema decisionale online
  • Le miscele candidate sono simulate interpolando adattatori a basso rango
  • L'articolo è pubblicato su arXiv con ID 2605.15220
  • Il titolo è 'Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time'

Entità

Istituzioni

  • arXiv

Fonti