ADAPT: Il riponderamento online migliora la cura dei dati LLM rispetto ai metodi offline
Un nuovo articolo su arXiv propone ADAPT (Adaptive Data reweighting for Pretraining and FineTuning), un framework online per la cura dei dati nell'addestramento di LLM. A differenza dei metodi offline che separano la cura dall'addestramento tramite selezione statica o miscelazione, ADAPT regola dinamicamente l'importanza dei campioni attraverso la ponderazione della perdita durante l'addestramento. Utilizza tassi di apprendimento adattivi per campione guidati da segnali di qualità basati sulla similarità, preservando la diversità dei dati e migliorando la generalizzazione. L'approccio affronta il sovraccarico ingegneristico e la fragilità delle pipeline offline che richiedono una riesecuzione in caso di cambiamenti del modello o del compito. L'articolo è disponibile su arXiv:2605.05227.
Fatti principali
- ADAPT è un framework di riponderamento online per la cura dei dati nell'addestramento di LLM.
- Utilizza tassi di apprendimento adattivi per campione guidati da segnali di qualità basati sulla similarità.
- I metodi offline separano la cura dall'addestramento, causando sovraccarico ingegneristico e fragilità.
- ADAPT regola dinamicamente l'importanza dei campioni tramite ponderazione della perdita durante l'addestramento.
- L'approccio preserva la diversità dei dati e migliora la generalizzazione.
- Articolo disponibile su arXiv:2605.05227.
- La cura dei dati è critica ma poco esplorata nell'addestramento di LLM.
- I metodi offline alterano la dimensione dei dati tramite filtraggio rigido o ricampionamento.
Entità
Istituzioni
- arXiv