MinT: Infrastruttura Gestita per Addestramento e Servizio di LLM
Il MindLab Toolkit (MinT) funge da infrastruttura gestita per Low-Rank Adaptation (LoRA), facilitando il post-addestramento e la distribuzione online di modelli linguistici di grandi dimensioni. È particolarmente adatto per scenari in cui numerose politiche addestrate emergono da un numero limitato di costosi dispiegamenti di modelli di base. Invece di creare un checkpoint completo unito per ogni politica, MinT mantiene il modello di base e processa le revisioni dell'adattatore LoRA esportate attraverso varie fasi, tra cui rollout, aggiornamento, esportazione, valutazione, servizio e rollback, nascondendo efficacemente l'addestramento distribuito e il movimento dei dati dietro un'interfaccia di servizio. MinT offre scalabilità in tre dimensioni: Scale Up migliora il LoRA RL per architetture dense e MoE avanzate, validato per oltre 1 trilione di parametri; Scale Down esporta gli adattatori LoRA, potenzialmente inferiori all'1% della dimensione del modello di base, ottenendo una riduzione di 18,3x nei passaggi misurati per un modello da 4B; e Scale Out supervisiona più dispiegamenti di modelli di base e migliaia di adattatori. Il sistema è ottimizzato per gestire milioni di LLM in modo efficiente.
Fatti principali
- MinT è un'infrastruttura gestita per il post-addestramento e il servizio online di LoRA.
- Si rivolge a contesti con molte politiche addestrate su pochi dispiegamenti costosi di modelli di base.
- MinT mantiene il modello di base residente e sposta le revisioni dell'adattatore LoRA attraverso un ciclo di vita.
- Scale Up estende LoRA RL ad architetture dense e MoE di frontiera.
- Scale Down sposta solo l'adattatore LoRA esportato, inferiore all'1% della dimensione del modello di base in impostazioni rank-1.
- Il passaggio solo dell'adattatore riduce il passo misurato di 18,3x su un modello da 4B.
- Scale Out gestisce più dispiegamenti di modelli di base e migliaia di adattatori.
- Addestramento e servizio validati oltre 1T parametri totali.
Entità
—