PILOT: Ottimizzatore Adattivo Regola le Regole di Aggiornamento Durante l'Addestramento

ai-technology · 2026-05-26

Presentiamo PILOT (Policy-Informed Learned OpTimizer), un nuovo ottimizzatore che modifica la propria strategia di aggiornamento durante l'addestramento del deep learning valutando l'accordo di direzione del gradiente. A differenza degli ottimizzatori statici tradizionali, che mantengono una forma funzionale predeterminata, PILOT sfrutta questo accordo come indicatore della stabilità locale dell'addestramento. Ciò gli consente di passare tra aggiornamenti basati su momentum, normalizzazione e segno in risposta a gradienti stabili, rumorosi o incoerenti. I test su FashionMNIST e CIFAR-10 dimostrano che PILOT supera costantemente gli altri ottimizzatori in termini di accuratezza su reti convoluzionali. Questo metodo innovativo supera i limiti degli ottimizzatori statici che non riescono ad adattarsi alla natura dinamica del comportamento del gradiente attraverso il panorama della funzione di perdita.

Fatti principali

PILOT sta per Policy-Informed Learned OpTimizer
Adatta il comportamento di aggiornamento durante l'addestramento in base all'accordo di direzione del gradiente
L'accordo di direzione del gradiente segnala la stabilità locale dell'addestramento
L'ottimizzatore si regola quando i gradienti diventano stabili, rumorosi o incoerenti
Testato sui dataset FashionMNIST e CIFAR-10
Ha raggiunto la massima accuratezza tra gli ottimizzatori valutati su reti convoluzionali
Gli ottimizzatori statici hanno una forma funzionale fissa prima dell'inizio dell'addestramento
L'addestramento può passare tra regimi stabili, rumorosi e incoerenti

Entità

—

Fonti

arXiv cs.AI — 2026-05-26