ARTFEED — Contemporary Art Intelligence

LBW-Guard: Controllo Autonomo Vincolato per l'Addestramento di Modelli Linguistici

ai-technology · 2026-05-20

Uno studio recente presenta Learn-by-Wire Guard (LBW-Guard), un livello di governance autonomo progettato per migliorare il controllo dell'addestramento dei modelli linguistici al di sopra di AdamW, garantendo stabilità in scenari ad alto stress. LBW-Guard monitora la telemetria dell'addestramento, identifica regimi soggetti a instabilità e implementa un controllo vincolato sull'esecuzione dell'ottimizzatore, mantenendo obiettivi di addestramento fissi. La valutazione ha utilizzato un framework di stress e robustezza incentrato su Qwen2.5 con WikiText-103, usando Qwen2.5-7B come riferimento principale, insieme a confronti con Qwen2.5-3B e Qwen2.5-14B, valutazioni dello stress del tasso di apprendimento, benchmark di gradient-clipping e una validazione full-parameter senza LoRA su TinyLlama-1B. Nello scenario di riferimento 7B, LBW-Guard ha ottenuto una riduzione della perplessità finale da 13.21 a 10.74, con un miglioramento del 18.7%. Lo studio affronta problemi di instabilità, esecuzioni inefficienti e calcolo eccessivo in condizioni di tassi di apprendimento elevati, scala e stress di runtime.

Fatti principali

  • LBW-Guard è un livello di controllo autonomo vincolato per l'addestramento al di sopra di AdamW.
  • Osserva la telemetria dell'addestramento e applica un controllo vincolato all'esecuzione dell'ottimizzatore.
  • La valutazione utilizza modelli Qwen2.5 (3B, 7B, 14B) su WikiText-103.
  • Include test di stress del tasso di apprendimento, baseline di gradient-clipping e un sanity check su TinyLlama-1B.
  • Nell'impostazione 7B, LBW-Guard riduce la perplessità da 13.21 a 10.74 (miglioramento del 18.7%).
  • Affronta l'instabilità in condizioni aggressive di tasso di apprendimento, scala e stress di runtime.
  • Preserva obiettivi di addestramento fissi mentre applica il controllo.
  • Pubblicato su arXiv con ID 2605.19008.

Entità

Istituzioni

  • arXiv

Fonti